NVIDIA GPU 上稀疏矩阵的基本线性代数

下载 文档 示例 支持 反馈

cuSPARSE 库为稀疏矩阵提供经 GPU 加速的基本线性代数子程序,与仅使用 CPU 的替代方案相比,这一程序的执行速度有显著的提升。此库提供了用于构建 GPU 加速型求解器的功能。在从事机器学习、计算流体力学、地震勘探及计算科学等应用的工程师和科学家群体中,cuSPARSE 得到了广泛采用。通过使用 cuSPARSE,应用将能自动从定期性能提升及全新 GPU 架构中受益。cuSPARSE 库包含在 NVIDIA HPC SDKCUDA 工具包中。

探索新版本中的新变化……

cuSPARSE 性能

cuSPARSE 库针对 NVIDIA GPU 上的性能进行了大量优化,SpMM 性能比仅使用 CPU 的替代方案快 30 到 150 倍。

cuSPARSE 主要特性

  • 支持密集型、COO、CSR、CSC 和分块 CSR 稀疏矩阵格式
  • 全套稀疏例程,涵盖稀疏向量和密集向量运算、稀疏矩阵和密集向量运算,以及稀疏矩阵和密集矩阵运算。
  • 用于稀疏矩阵之间加法和乘法的例程
  • 适用于稀疏密集向量乘法 (SpVV)、稀疏矩阵密集向量乘法 (SpMV) 和稀疏矩阵密集矩阵乘法 (SpMM) 的通用高性能 API
  • ILU0 和 IC0 预处理器