NVIDIA 性能库

NVIDIA 性能库 (NVPL) 是一组为 Arm 64 位架构优化的核心数学库,NVPL 支持轻松将 HPC 应用程序移植到 NVIDIA Grace™ CPU 平台,帮助获得行业优质的性能与效率。

下载文档反馈


主要特性

无缝移植到 Grace CPU

NVPL 数学库是标准 C 和 Fortran 数学 API 的直接替代品。这使得现有的 HPC 应用程序可以轻松移植到基于 Grace 的系统,而无需更改源代码。

针对 Arm 架构进行优化

NVPL 专门针对 Arm 64 位 CPU 进行了调整,可确保数学应用程序在 Grace 微架构上实现峰值效率。NVPL 允许您在数据中心充分利用 NVIDIA 芯片。

使用标准数学子程序

许多 HPC 应用依赖于对应用性能至关重要的标准化数学 API,如 BLAS、FFTW 和 LAPACK。NVPL 为 Grace CPU 提供了这些基本库的优化实现。


NVPL 库 (测试版)

NVPL BLAS

采用行业标准的基本线性代数子程序 (BLAS) ,通过单线程和多线程接口针对 NVIDIA Grace CPU 架构进行优化。

NVPL BLAS efficiency chart

NVPL LAPACK Performance  chart

NVPL LAPACK

在 NVIDIA Grace CPU 上用于计算机视觉、线性优化等的密集直接线性求解器和特征求解器。

NVPL FFT

适用于计算物理学和量子化学等应用的快速里叶变换 (FFT) 。

NVPL FFT Performance chart

NVPL TENSOR

用于 Grace CPU 上深度学习和推理的张量收缩、归约和元素级运算。

NVPL RAND

高性能随机数生成 (RNG) 可实现快速、高质量的随机数。

NVPL SPARSE

用于加速机器学习、流体动力学等的稀疏线性代数子程序。

NVPL ScaLAPACK

专为分布式显存并行计算环境设计的 LAPACK 扩展。


资源

准备好开始使用 NVIDIA 性能库了吗?

下载