数据中心深度学习产品性能中心

NVIDIA 数据中心深度学习产品性能

可复现的性能

通过 IT 领导者的战略指南了解如何降低每个 token 的成本，并最大化 AI 模型的价值。

查看以下方面的性能数据：

最新 NVIDIA 数据中心产品

训练至收敛

在实际应用中部署 AI 需要训练网络以指定的精度进行收。这是测试 AI 系统是否准备好在现场部署以提供有意义的结果的最佳方法。

了解详情

AI 推理

现实世界的推理需要高吞吐量和低延迟，并在各种用例中实现最高效率。借助行业领先的解决方案，客户可以将 AI 模型快速部署到现实世界的生产环境中，并从数据中心到边缘实现出色性能。

了解详情

高性能计算 (HPC) 加速

现代 HPC 数据中心对于解决关键的科学和工程挑战至关重要。NVIDIA 数据中心 GPU 为数据中心带来变革，在降低网络开销的同时提供突破性性能，从而节省 5 倍至 10 倍的成本。

了解详情

NVIDIA Blackwell Ultra 为代理式 AI 提供高达 50 倍的性能提升和 35 倍的成本降低

NVIDIA Blackwell Ultra 专为加速新一代代理式 AI 而打造，可在大幅降低成本的同时提供突破性的推理性能。微软、CoreWeave 和 Oracle Cloud Infrastructure 等云提供商正在大规模部署 NVIDIA GB300 NVL72 系统，用于低延迟和长上下文用例，例如代理式编码和编码助手。

这是通过 NVIDIA Blackwell、NVLink™ 和 NVLink Switch 之间的深度联合设计实现横向扩展；通过 NVFP4 实现低精度精度；通过 NVIDIA Dynamo 和 TensorRT™ LLM 实现速度和灵活性，以及使用社区框架 SGLang、vLLM 等进行开发来实现的。

探索技术成果

作为 NVIDIA“Think SMART”框架的一部分，数据中心插图展示了图像、音频、视觉等领域的多模态 AI token。

深度学习产品性能资源

NVIDIA 数据中心深度学习产品性能常见问题

探索软件容器、模型、Jupyter Notebook 和文档。

NVIDIA NGC 目录