NVIDIA CUDA-X 库

NVIDIA CUDA-X™ 库基于 CUDA® 构建,是一系列库的集合,与仅使用 CPU 的替代方案相比,可在包括 AI 和高性能计算在内的应用领域中提供显著更高的性能。


从资源受限的物联网设备到自动驾驶汽车,再到全球最大的超级计算机,NVIDIA 库无处不在。因此,用户可以通过不断扩展的算法集获得高度优化的实现。无论是构建新应用还是加速现有应用,开发者都可以利用 NVIDIA 库,以最简单的方式开始 GPU 加速。



组件



CUDA 数学库

GPU 加速的数学库为分子动力学、计算流体动力学、计算化学、医学成像和地震勘探等领域的计算密集型应用奠定了基础。


Decorative image of cuBLAS math library

cuBLAS

GPU 加速的基本线性代数 (BLAS) 库。


了解详情
 Decorative image of cuFFT math library

cuFFT

用于快速里叶变换实现的 GPU 加速库。


了解详情
Decorative image of cuRAND math library

cuRAND

GPU 加速的随机数生成。


了解详情
Decorative image of cuSOLVER math library

cuSOLVER

GPU 加速的密集和稀疏直接求解器。


了解详情
Decorative image of cuSPARSE math library

cuSPARSE

适用于稀疏矩阵的 GPU 加速 BLAS。


了解详情
 Decorative image of cuTENSOR math library

cuTENSOR

GPU 加速的张量线性代数库。


了解详情
Decorative image of cuDSS math library

cuDSS

GPU 加速的直接稀疏求解器库。


了解详情
Decorative image of CUDA math library

CUDA 数学 API

GPU 加速的标准数学函数 API。


了解详情
Decorative image of AmgX math library

AmgX

GPU 加速的线性求解器,用于模拟和隐式非结构化方法。


了解详情

Python 中的 NVIDIA 数学库

为 Python 生态系统启用 GPU 加速的数学运算。

nvmath-python

nvmath-python (测试版) 是一个开源库,可对 NVIDIA 数学库中的核心数学运算进行高性能访问。


了解详情

科学计算库

适用于需要遵守数学对称性的神经网络的应用,特别是分子结构、蛋白质和材料等 3D 几何数据的等方差。

cuEquivariance

开源 Python 库,旨在加速等变神经网络的构建和执行,尤其是处理 3D 空间中数据旋转和平移的神经网络。

了解详情

并行算法库

GPU 加速的高效并行算法库,用于 C++ 中的多项运算,以及在研究自然科学、物流、旅行规划等领域的关系时与图形一起使用。

Thrust

GPU 加速的 C++ 并行算法和数据结构库。

了解详情

计算光刻库

旨在应对纳米级计算光刻的现代挑战。

cuLitho

包含优化工具和算法的库,可使用 GPU 加速计算光刻和半导体制造。

了解详情

量子库

为量子计算实现仿真、HPC 集成和 AI。

cuQuantum

NVIDIA cuQuantum 是一组用于加速量子计算模拟的高度优化库。

开始使用

cuPQC

用于加速后量子加密 (PQC) 工作流程的优化库 SDK。

探索文档

数据处理库

GPU 加速库,可加速表格、文本和图像数据的数据处理工作流程。

RAPIDS cuDF

无需更改代码即可加速表格数据,包括 pandas 和 Polars。

探索文档

RAPIDS cuML

无需更改代码,即可在 scikit-learn、UMAP 和 HDBSCAN 中加速 ML 算法。

探索文档

RAPIDS cuGraph

借助 GPU 加速的 NetworkX 扩展和加速图形分析。

探索文档

NVIDIA cuVS

应用 cuVS 算法来加速数据挖掘和语义搜索应用的向量搜索,包括 GPU 原生近邻算法 CAGRA 的出色性能。

了解详情

NeMo Curator

NVIDIA NeMo Curator 通过大规模处理文本、图像和视频数据进行训练和自定义,提高生成式 AI 模型的准确性。它还提供用于生成合成数据的预构建流程,以定制和评估生成式 AI 系统。

了解详情

Morpheus

开放式应用框架,可优化网络安全 AI 工作流,以分析大量实时数据。

了解详情

GPU Direct Storage

NVIDIA GPUDirect® Storage 可在本地或远程存储 (例如 NVMe 或 NVMe over Fabric (NVMe-oF)) 与 GPU 显存之间创建直接数据路径。

了解详情

Dask

使用 Dask 上的 RAPIDS 将数据科学工作流扩展到多个节点。

前往 GitHub

适用于 Apache Spark 的 RAPIDS 加速器

只需更改最少的代码,即可加速现有的 Apache Spark 应用。

前往 GitHub

图像和视频库

GPU 加速库,用于使用 CUDA 和 GPU 的专用硬件组件进行图像和视频解码、编码和处理。


RAPIDS cuCIM

加速 n 维 (尤其是生物医学图像) 的输入/ 输出 (IO) 、计算机视觉和图像处理。

探索文档

CV-CUDA

开源库,用于视觉 AI 工作流中的高性能、GPU 加速的预处理和后处理。

了解详情

NVIDIA DALI

可移植的开源库,用于解码和增强图像和视频,以加速深度学习应用程序。

了解详情

nvJPEG

用于 JPEG 解码的高性能 GPU 加速库。

了解详情

NVIDIA 性能基元

GPU 加速的图像、视频和信号处理功能。

了解详情

NVIDIA 视频编解码器 SDK

在 Windows 和 Linux 上执行硬件加速的视频编码和解码。

了解详情

NVIDIA 光流 SDK

展示 NVIDIA GPU 的最新硬件功能,专用于计算图像之间像素的相对运动。

了解详情

通信库

性能经过优化的多 GPU 和多节点通信基元。


Decorative image of NVSHMEM communication library

NVSHMEM

适用于 GPU 显存的 OpenSHMEM 标准,以及用于提高 GPU 性能的扩展程序。


了解详情
Decorative image of NCCL communication library

NCCL

用于快速多 GPU、多节点通信的开源库,可在保持低延迟的同时更大限度地提高带宽。


了解详情

深度学习核心库

适用于使用 CUDA 和 GPU 专用硬件组件的深度学习应用程序的 GPU 加速库。


NVIDIA CUTLASS

针对 CUDA 执行和内存层次结构中的高性能线性代数和张量运算优化抽象。

了解详情

NVIDIA TensorRT-LLM

用于生产部署的高性能深度学习推理优化器和运行时。

了解详情

NVIDIA cuDNN

GPU 加速的深度神经网络基元库。

了解详情

合作伙伴库


OpenCV

GPU 加速的开源库,用于计算机视觉、图像处理和机器学习,现在支持实时操作。

了解详情

FFmpeg

包含音频和视频处理插件库的开源多媒体框架。

了解详情

ArrayFire

GPU 加速的开源库,用于矩阵、信号和图像处理。

了解详情

MAGMA

由 Magma 开发的用于异构架构的 GPU 加速线性代数例程。

了解详情

IMSL Fortran 数值库

由 RogueWave 提供的 GPU 加速开源 Fortran 库,包含数学、信号和图像处理以及统计功能。

了解详情

Gunrock

专为 GPU 设计的图形处理库。

了解详情

CHOLMOD

GPU 加速的稀疏直接求解器函数,包含在 SuiteSparse 线性代数包中。

了解详情

Triton Ocean SDK

Triton 提供的海洋、游戏中的水体、仿真和训练应用的实时视觉仿真。

了解详情

CUVIlib

用于加速医疗、工业和国防领域成像应用的基元。

了解详情


资源


View CUDA-X Documentation

文档

View CUDA-X Training

培训

Joing the CUDA-X Community

社区

开始使用


NVIDIA 开发者计划成员可以抢先体验所有 CUDA 库版本以及 NVIDIA 在线错误报告和功能请求系统。


加入开发者计划