cuSOLVERMp 多节点多 GPU 主机 API
NVIDIA cuSOLVERMp 库是一个高性能分布式内存 GPU 加速库,可提供用于解决密集线性系统和特征值问题的工具。该库可作为独立下载,也包含在 NVIDIA HPC SDK 中。
下载
cuSOLVER 性能
cuSOLVER 11 可自动利用 DMMA Tensor Core。得益于 A100 以及第三代 NVLINK 和 NVSWITCH,DGX A100 尽管拥有一半的 GPU 数量,但仍比 DGX-2 快 2 倍以上。
cuSOLVER 的主要特性
-
cusolverDN:关键 LAPACK 密集求解器的速度比 MKL 快 3-6 倍。
- Dense Cholesky、LU、SVD、QR
- 应用包括:优化、计算机视觉、CFD
-
cusolverSP
- 稀疏直接求解器
- 对称和广义对称本征求解器
- 应用包括:牛顿方法、化学动力学
-
cusolverRF
- 稀疏重构求解器
- 应用包括:化学、ODE、Circuit 仿真
现已推出:cuSOLVERMp
NVIDIA cuSOLVERMp 库是一个高性能分布式内存 GPU 加速库,可提供用于解决密集线性系统和特征值问题的工具。该库可独立下载,也包含在 NVIDIA HPC SDK 中。