CUDA 基元为 GPU 上的数据科学提供动力支持

NVIDIA 提供一套机器学习和分析软件库,旨在全面加速 GPU 上的端到端数据科学流程。这项成就得益于我们超过 15 年的 CUDA 开发历程。经由 GPU 加速的库吸取了低层级 CUDA 基元的优势。诸如线性代数、高等数学和并行化算法等的众多库为计算密集型应用生态系统奠定了基础。

借助 NVIDIA 提供的库,您将能高效实现一些常规扩展和优化的算法。无论是构建新应用还是尝试加速现有应用,NVIDIA 提供的库都能让您以简单易学的方式开始使用 GPU。您可以将 NVIDIA CUDA-X AI 库作为 CUDA 工具包和 NVIDIA RAPIDS 的一部分进行下载。

线性代数和数学库

cuBLAS

经 GPU 加速的标准基本线性代数子程序 (BLAS) 的快速实现

cuSPARSE

面向稀疏矩阵提供经 GPU 加速的基本线性代数子程序

cuSOLVER

密集和稀疏直接求解器集合,可加速线性优化应用及更多其他应用

并行算法库

NCCL

实现针对 NVIDIA GPU 进行性能优化的多 GPU 和多节点聚合通信基元

Thrust

提供灵活的高级 GPU 编程接口,以提高开发者的工作效率


RAPIDS

许多数据科学开发者开始致力于一个名为 RAPIDS 的开源项目研究。作为 CUDA-X AI 的组成部分,RAPIDS 依靠 NVIDIA® CUDA® 基元进行低级别计算优化,但通过用户友好型 Python 接口实现了 GPU 并行化和高带宽显存速度。

RAPIDS 还专注于 ETL、分析和机器学习的通用数据准备任务。此软件库中包含一个常见的 DataFrame API,该 API 集成了各种机器学习算法,可让开发者在无需付出典型的序列化代价的前提下实现端到端流水线加速。


RAPIDS 工作流程

  • 分析和 ETL:cuDF 是一个基于 Apache Arrow 的 DataFrame 操作库,可在模型训练数据准备阶段加速数据的加载、过滤和操作流程。经核心加速的 CUDA DataFrame 操作基元的 Python 绑定与 pandas 接口类似,便于 pandas 用户顺利上手。
  • 机器学习:cuML 是一个 GPU 加速的机器学习库集合,将提供 scikit-learn 中所有机器学习算法的 GPU 版本。
  • 图形分析:cuGRAPH 是一个图形分析库集合,可无缝集成到 RAPIDS 数据科学平台。

RAPIDS 特性

方便集成

不必学习新工具,只需稍加更改代码即可加速 Python 数据科学工具链。

超高模型精度

通过提升模型的迭代速度和部署频率,提高机器学习模型的准确率。

减少训练时间

借助近乎交互式的数据科学大幅提高工作效率。

开源

这款开源软件由 NVIDIA 提供支持并基于 Apache Arrow 构建,具有可定制性、可扩展性和互操作性。


开始使用

在 GPU 上借助 RAPIDS 畅享机器学习和数据科学加速体验。

RAPIDS 主页