NVIDIA 性能库

NVIDIA Performance Libraries(NVPL)是一组为 Arm 64 位架构优化的关键数学库。NVPL 可帮助您轻松将 HPC 应用移植到 NVIDIA Grace™ CPU 平台上,以实现出色的性能和能效表现。

下载文档反馈


关键特性

无缝迁移至 Grace CPU

NVPL 数学库是标准 C 和 Fortran 数学 API 的可直接替换版本,使现有 HPC 应用能够在无需修改源代码的情况下轻松迁移至基于 Grace 的系统。

针对 Arm 架构进行优化

NVPL 为 Arm 64 位 CPU 专门调优,确保数学类应用在 Grace 微架构上实现高效运行。借助 NVPL,可以充分发挥 NVIDIA 数据中心芯片的计算潜能。

使用标准数学子程序

许多 HPC 应用依赖于诸如 BLAS、FFTW 和 LAPACK 等标准化数学 API,这些接口对应用性能至关重要。NVPL 为 Grace CPU 提供这些关键库的优化实现。


NVPL 库

NVPL BLAS

面向 NVIDIA Grace CPU 架构优化的行业标准 Basic Linear Algebra Subprograms (BLAS),并提供单线程与多线程接口。

Figure caption

NVPL LAPACK

面向计算机视觉、线性优化等多种应用场景,在 NVIDIA Grace CPU 上运行的稠密直接线性求解器和特征值求解器。

NVPL FFT

快速里叶变换 (FFT) ,适用于计算物理学和量子化学等应用。

NVPL TENSOR

用于在 Grace CPU 上执行深度学习训练和推理的张量收缩、归约以及逐元素运算。

NVPL RAND

面向高性能计算场景的高性能随机数生成 (RNG),可快速生成高质量随机数。

NVPL SPARSE

用于加速机器学习、流体力学等工作负载的稀疏线性代数子程序库。

NVPL ScaLAPACK

为分布式内存并行计算环境设计的 LAPACK 拓展库。


资源

准备好开始使用 NVIDIA Performance Libraries 了吗?

下载