NVIDIA CUDA-X

GPU 加速库

NVIDIA® CUDA-X 依托 NVIDIA CUDA® 而构建，是多种库、工具和技术的集合；与仅使用 CPU 的替代产品相比，CUDA-X 可为人工智能 (AI)、高性能计算 (HPC) 等多个应用领域带来显著提高的性能。

NVIDIA 库的应用领域非常广泛，其中包括资源受限的物联网设备、自动驾驶汽车，以及大型超级计算机。通过使用这些库，实现不断扩展的算法集的过程将得到大幅优化。无论是构建新应用还是加速现有应用，NVIDIA 库都能让您以简单易学的方式开始使用 GPU 加速。

组件

图像和视频库

合作伙伴库

数学库

GPU 加速的数学库为分子动力学、计算流体力学、计算化学、医学成像和地震勘探等领域的计算密集型应用奠定了基础。

cuBLAS

GPU 加速的基本线性代数 (BLAS) 库

cuFFT

GPU 加速的快速傅里叶变换库

CUDA 数学库

GPU 加速的标准数学函数库

cuRAND

GPU 加速的随机数生成 (RNG)

cuSOLVER

GPU 加速的密集和稀疏直接求解器

cuSPARSE

GPU 加速的稀疏矩阵 BLAS

cuTENSOR

GPU 加速的张量线性代数库

AmgX

GPU 加速的用于模拟和隐式非结构化方法的线性求解器

并行算法库

GPU 加速的高效并行算法库，用于 C++ 中的多项运算，并在研究自然科学、物流、旅行规划等领域的关系时与图形一起使用。

Thrust

GPU 加速的 C++ 并行算法和数据结构库

图像和视频库

GPU 加速库，用于通过 CUDA 和 GPU 的专用硬件组件来进行图像和视频解码、编码和处理。

nvJPEG

用于 JPEG 解码的高性能 GPU 加速库。

NVIDIA 性能基元

提供 GPU 加速的图像、视频和信号处理功能

NVIDIA 视频编解码器 SDK

一套完整的 API、示例和文档，用于在 Windows 和 Linux 上执行硬件加速的视频编码和解码。

NVIDIA 光流 SDK

展示 NVIDIA Turing™ 的最新硬件功能，该功能专用于计算图像之间像素的相对运动。

通信库

性能经过优化的多 GPU 和多节点通信基元。

NVSHMEM

针对 GPU 显存的 OpenSHMEM 标准，旨在通过扩展提升 GPU 性能。

NCCL

用于快速多 GPU、多节点通信的开放源代码库，可在保持低延迟的同时更大限度地增加带宽。

深度学习库

GPU 加速库，用于利用 CUDA 和专用 GPU 硬件组件的深度学习应用。

NVIDIA cuDNN

GPU 加速的深度神经网络基元库

NVIDIA TensorRT™

用于生产部署的高性能深度学习推理优化器和运行时

NVIDIA Riva

用于开发互动性强且符合情境的 AI 对话应用的平台

NVIDIA DeepStream SDK

实时串流分析工具包，用于基于 AI 的视频理解和多传感器处理

NVIDIA DALI

便携式开放源代码库，用于解码和增强图像和视频，从而加速深度学习应用。

合作伙伴库

OpenCV

GPU 加速的开放源代码库，用于计算机视觉、图像处理和机器学习，现支持实时操作

FFmpeg

开放源代码多媒体框架，含用于音频和视频处理的插件库

ArrayFire

GPU 加速的开放源代码库，用于矩阵、信号和图像处理

MAGMA

由 Magma 开发并由 GPU 加速的异构架构专用线性代数例程

IMSL Fortran 数值库

由 RogueWave 开发并由 GPU 加速的开放源代码 Fortran 库，含数学、信号和图像处理以及统计专用的函数

Gunrock

专为 GPU 设计的图形处理库

CHOLMOD

GPU 加速的稀疏直接求解器函数，包含在由 Prof 编写的 SuiteSparse 线性代数包中

Triton Ocean SDK

由 Triton 开发的游戏、模拟和训练应用中的海洋与水体实时视觉模拟

CUVIlib

用于加速医学、工业和国防领域成像应用的基元

相关资源

培训

社区

开始使用

NVIDIA 开发者计划成员可以抢先体验所有 CUDA 库版本，还可访问 NVIDIA 的在线错误报告和功能请求系统。

加入开发者计划