立即下载 DOCA,开启高性能AI 网络之旅,实现“一站式” 编程
数据科学

借助 NVIDIA Grace CPU 提升数学优化性能和能效

数学优化是一种功能强大的工具,可以帮助企业和人们做出更明智的决策,并实现任意数量的目标。这些目标包括提高运营效率、降低成本和提高客户满意度。许多日常用例都可以应用数学优化,例如调度航班、定价酒店房间、选择 GPS 路线和规划货运卡车路线等。

然而,数学优化计算需求很高。模型复杂性和数据集大小需要复杂的 AI 算法和高性能计算。由于对更快、更好的数学优化解决方案的需求不断增长,从系统、软件平台到加速库,全栈创新是必需的。

Gurobi 成立于 2008 年,是一家数学优化求解器,可解决复杂问题,并在数秒内向全球各行各业的 1200 多家客户提供优化解决方案。该公司获得了一台基于 Supermicro NVIDIA MGX 的系统,由 NVIDIA GH200 Grace Hopper 超级芯片提供支持,该系统能够以低功耗实现快速性能。

这篇博客文章探讨了使用基于 Arm 的 NVIDIA Grace CPU 的基准测试结果和用例,这些用例表明了效率的提高。

为混合整数编程库设置计算优化测试环境

测试平台由 Supermicro 的单个 NVIDIA Grace Hopper 超级芯片服务器、四台 AMD EPYC 7313P 服务器组成的集群(每台服务器均具有 16 个核心和 256 GB 的 DDR4 内存)以及在 Ubuntu 22.04 上的 Gurobi Optimizer 11.0 组成。

NVIDIA Grace Hopper 超级芯片通过高带宽、一致性 NVIDIA NVLink-C2C(芯片到芯片)互连技术,将基于 Arm 的 NVIDIA Grace CPU 与 NVIDIA Hopper GPU 相结合。Grace CPU 具有 72 个核心和 480 GB 的高性能、低功耗双数据速率 5 倍(LPDDR5X)内存。

为了评估性能,Gurobi 使用混合整数编程库 (MIPLIB) 2017 中的代表性基准集进行了一系列实验,该集包含 240 个真实世界优化实例。然后,将 NVIDIA Grace CPU 在 Grace Hopper 超级芯片上的结果与客户常用的 AMD EPYC 服务器集群进行了比较。

初步结果

第一个图形显示了 MIPLIB 基准集中的硬模型的运行时间。

Grace Hopper 在大多数困难模型上表现优于 EPYC,平均运行时间约为 80 秒,相比之下 AMD 的平均运行时间为 130 秒,提高了 38%。

A bar graph showing AMD EPYC 7313P on the left compared to the NVIDIA Grace CPU on the right with red bars showing runtime and dark blue bars showing PAR10 performance. Results show the NVIDIA Grace CPU outperforms AMD EPYC 7313P with lower runtime.
图 1. NVIDIA Grace CPU 上运行时的几何平均值与 AMD EPYC 7313P 的比较

下图显示了整个 MIPLIB 基准测试集的吞吐量和能耗。时间和能耗越低,性能越好。这意味着,性能好的系统应该具有较低的时间和能耗。同样,在这两个指标上,NVIDIA Grace CPU 的性能都优于 AMD EPYC 7313P,具体来说,运行速度提高了近 23%,而能耗降低了 46%。

A bar graph showing AMD EPYC 7313P with 16 threads on the left, 12x NVIDIA Grace CPU with 12 threads in the middle, and 16x NVIDIA Grace CPU with 8 threads on the right. Red bars show elapsed time in hours and light blue bars show energy usage in kWh.
图 2. NVIDIA Grace CPU 的吞吐量和能耗与 AMD EPYC 7313P 的比较

图 3 显示了 MIPLIB 基准测试集的能耗,以千瓦时为单位。对于每种配置,Grace Hopper 在两个线程数量上消耗的能耗均低于 AMD EPYC 7313P,结果是:Grace Hopper 消耗的能耗少于 AMD EPYC 7313P,无论是哪种线程数量。

  • 在 8 个线程的情况下,NVIDIA Grace CPU 的功耗约为 1.4 kWh,比 AMD 的 1.75 kWh 低 20%。
  • 对于 12 个线程,NVIDIA Grace CPU 的耗电量约为 1.6 千瓦时,而 AMD 的耗电量为 2.6 千瓦时,相比之下提高了 38%。
A bar graph showing AMD EPYC 7313P with 16 threads, 12x NVIDIA Grace CPU with 12 threads, 16x NVIDIA Grace CPU with 8 threads, and AMD EPYC 7313P with 8 threads. Blue bars show relative performance on the MIPLIB Benchmark set with the Grace CPU outperforming AMD EPYC 7313P.
图 3. NVIDIA Grace CPU 上的 MIPLIB 基准集能耗(千瓦时),与 AMD EPYC 7313P 的比较。

这些结果表明,NVIDIA Grace CPU 上的 Gurobi Optimizer 在解决具有挑战性的 MIP 模型方面比 AMD EPYC 7313P 实现了显著的加速和节能。

这归功于 NVIDIA Grace CPU 出色的多处理能力,它能够高效地处理优化器的高计算和内存需求。

借助 NVIDIA Grace Hopper 超级芯片,我们可以快速、高效地解决问题

初步基准测试表明,Gurobi Optimizer 和 NVIDIA Grace Hopper 超级芯片支持更快的计算性能,同时也具有更低的能耗。他们计划通过额外的调整和测试来改进其结果。

对于希望提高能效,同时以更出色的性能应对复杂业务挑战的各行各业的公司而言,这为他们提供了广阔的前景。为了更好地了解测试和结果,请观看 NVIDIA GTC 的点播会议。同时,如果您想了解数学优化如何帮助解决最复杂的挑战,请查看 Gurobi 资源中心

 

标签