NVIDIA 性能库

NVIDIA Performance Libraries（NVPL）是一组为 Arm 64 位架构优化的关键数学库。NVPL 可帮助您轻松将 HPC 应用移植到 NVIDIA Grace™ CPU 平台上，以实现出色的性能和能效表现。

关键特性

NVPL 数学库是标准 C 和 Fortran 数学 API 的可直接替换版本，使现有 HPC 应用能够在无需修改源代码的情况下轻松迁移至基于 Grace 的系统。

NVPL 为 Arm 64 位 CPU 专门调优，确保数学类应用在 Grace 微架构上实现高效运行。借助 NVPL，可以充分发挥 NVIDIA 数据中心芯片的计算潜能。

许多 HPC 应用依赖于诸如 BLAS、FFTW 和 LAPACK 等标准化数学 API，这些接口对应用性能至关重要。NVPL 为 Grace CPU 提供这些关键库的优化实现。

面向 NVIDIA Grace CPU 架构优化的行业标准 Basic Linear Algebra Subprograms (BLAS)，并提供单线程与多线程接口。

面向计算机视觉、线性优化等多种应用场景，在 NVIDIA Grace CPU 上运行的稠密直接线性求解器和特征值求解器。

快速里叶变换 (FFT) ，适用于计算物理学和量子化学等应用。

用于在 Grace CPU 上执行深度学习训练和推理的张量收缩、归约以及逐元素运算。

面向高性能计算场景的高性能随机数生成 (RNG)，可快速生成高质量随机数。

用于加速机器学习、流体力学等工作负载的稀疏线性代数子程序库。