数据中心/云端

2026年 5月 14日

NVIDIA Vera Rubin 平台如何解决代理式 AI 的纵向扩展问题

代理式推理通过引入非确定性轨迹（即AI智能体在执行任务时生成的动作、观察结果和决策），从根本上改变了推理工作负载的运行时特性。

2 MIN READ

2026年 5月 11日

隆重推出 NVIDIA Fleet Intelligence，实现实时 GPU 车队可视化和优化

大型 GPU 集群的计算能力带来了前所未有的创新机会，并在创纪录的时间内为客户提供价值。然而，这些进步带来了各种挑战。在规模化方面，

2 MIN READ

2026年 5月 8日

流式传输词元和工具：NVIDIA Dynamo 中的多回合代理线束支持

智能体交换必须保留结构化交互：助手通过一次或多次工具调用进行交错推理，随后用户轮流将相应的工具结果返回至模型上下文。

4 MIN READ

2026年 5月 7日

借助 Slurm 块调度在 NVIDIA GB200 NVL72 上实现峰值系统和工作负载效率

NVIDIA GB200 NVL72 通过在整个机架范围内扩展 NVIDIA NVLink 一致性，开创了一种全新的 GPU 集群构建方式。

3 MIN READ

2026年 5月 5日

借助极致协同设计构建日益复杂的代理式系统

生成式 AI 具有爆炸性的第一章由发送请求的人类和响应的模型定义。代理式章节有所不同。智能体不会遵循预先确定的动作序列。它们可以调用工具，

3 MIN READ

2026年 4月 29日

使用 NVIDIA 企业参考架构为 AI 工厂提供支持

下一波企业生产力浪潮将以AI工厂为基础。随着企业部署能够实现大规模推理、自动化和实时决策的代理式AI系统，

2 MIN READ

2026年 4月 28日

在 NVIDIA BioNeMo 中使用上下文并行性扩展生物分子建模

几十年来，计算生物学一直在简化主义妥协下运作。为了将复杂的生物系统整合到单个 GPU 的有限内存中，

2 MIN READ

2026年 4月 22日

借助 NVIDIA RTX PRO 4500 Blackwell Server Edition 和 NVIDIA vGPU 20 扩展 AI 就绪型数据中心

从 Microsoft Office 等生产力软件到更复杂的设计和工程工具，AI 集成正在重新定义主流企业应用。

4 MIN READ

2026年 4月 17日

借助 NVIDIA Dynamo 实现代理式推理的全栈优化

编程智能体开始大规模编写产品级代码。 Stripe 的智能体每周生成 1300 多个 PR。 Ramp 将 30%

4 MIN READ

2026年 4月 14日

NVIDIA NVbandwidth：测量 GPU 互连和显存性能的必备工具

在编写 CUDA 应用程序时，要编写出色的代码，您需要关注的最重要的一点是数据传输性能。这适用于单 GPU 和多 GPU 系统。

3 MIN READ

2026年 4月 11日

MiniMax M2.7 在 NVIDIA 平台上推进复杂 AI 应用的可扩展代理工作流程

MiniMax M2.7 的发布为流行的 MiniMax M2.7 模型增加了增强功能，该模型专为代理式线束以及推理、ML 研究工作流程、

2 MIN READ

2026年 4月 9日

使用 Slurm 在 Kubernetes 上运行大规模 GPU 工作负载

Slurm 是适用于 Linux 的开源集群管理和作业调度系统。它可以管理超过 65% 的 TOP500 系统的作业调度。

3 MIN READ

2026年 4月 9日

使用约 30 行 Python 和 NVIDIA nvCOMP 降低检查点成本

训练 LLM 需要定期检查点。这些模型权重、优化器状态和梯度的完整快照将保存到存储中，以便在中断后恢复训练。在规模上，这些检查点变得庞大 (…

5 MIN READ

2026年 4月 7日

在机架级超级计算机上运行 AI 工作负载：从硬件到拓扑感知调度

采用 NVIDIA Blackwell 架构的 NVIDIA GB200 NVL72 和 NVIDIA GB300 NVL72…

4 MIN READ

2026年 4月 2日

使用批量模式 VC-6 和 NVIDIA Nsight 加速视觉 AI 工作流

在视觉 AI 系统中，模型吞吐量不断提高。周围的工作流阶段必须与时俱进，包括解码、预处理和 GPU 调度。在上一篇文章中，

3 MIN READ

2026年 4月 2日

为资本市场实现单位数微秒级延迟推理

在算法交易中，缩短对市场事件的响应时间至关重要。为了与高速电子市场保持同步，对延迟敏感的公司通常使用 FPGA 和 ASIC 等专用硬件。

3 MIN READ