CV-CUDA 是一个开源项目,使开发者能够在云规模人工智能 (AI) 成像和计算机视觉 (CV) 工作负载中,构建由图形处理器 (GPU) 加速的预处理和后处理高效流程。CV-CUDA 拥有一套专门的 CV 和图像处理内核,这些内核针对数据中心 GPU 的性能进行了手动优化,可确保使用这些内核构建的处理流程得到执行,进而可在整个复杂的工作负载中提供更高的吞吐量。CV-CUDA 可以为端到端管道提供超过 4 倍的吞吐量改进,从而显着降低云计算成本和能源消耗。CV-CUDA 可与 C/C++、Python 和深度学习 (DL) 框架(如 PyTorch)轻松集成。