数据中心/云端
2026年 5月 14日
NVIDIA Vera Rubin 平台如何解决代理式 AI 的纵向扩展问题
代理式推理通过引入非确定性轨迹(即AI智能体在执行任务时生成的动作、观察结果和决策),从根本上改变了推理工作负载的运行时特性。
2 MIN READ
2026年 5月 11日
隆重推出 NVIDIA Fleet Intelligence,实现实时 GPU 车队可视化和优化
大型 GPU 集群的计算能力带来了前所未有的创新机会,并在创纪录的时间内为客户提供价值。然而,这些进步带来了各种挑战。在规模化方面,
2 MIN READ
2026年 5月 8日
流式传输词元和工具:NVIDIA Dynamo 中的多回合代理线束支持
智能体交换必须保留结构化交互:助手通过一次或多次工具调用进行交错推理,随后用户轮流将相应的工具结果返回至模型上下文。
4 MIN READ
2026年 5月 7日
借助 Slurm 块调度在 NVIDIA GB200 NVL72 上实现峰值系统和工作负载效率
NVIDIA GB200 NVL72 通过在整个机架范围内扩展 NVIDIA NVLink 一致性,开创了一种全新的 GPU 集群构建方式。
3 MIN READ
2026年 5月 5日
借助极致协同设计构建日益复杂的代理式系统
生成式 AI 具有爆炸性的第一章由发送请求的人类和响应的模型定义。代理式章节有所不同。 智能体不会遵循预先确定的动作序列。它们可以调用工具,
3 MIN READ
2026年 4月 29日
使用 NVIDIA 企业参考架构为 AI 工厂提供支持
下一波企业生产力浪潮将以AI工厂为基础。随着企业部署能够实现大规模推理、自动化和实时决策的代理式AI系统,
2 MIN READ
2026年 4月 28日
在 NVIDIA BioNeMo 中使用上下文并行性扩展生物分子建模
几十年来,计算生物学一直在简化主义妥协下运作。为了将复杂的生物系统整合到单个 GPU 的有限内存中,
2 MIN READ
2026年 4月 22日
借助 NVIDIA RTX PRO 4500 Blackwell Server Edition 和 NVIDIA vGPU 20 扩展 AI 就绪型数据中心
从 Microsoft Office 等生产力软件到更复杂的设计和工程工具,AI 集成正在重新定义主流企业应用。
4 MIN READ
2026年 4月 17日
借助 NVIDIA Dynamo 实现代理式推理的全栈优化
编程智能体开始大规模编写产品级代码。 Stripe 的智能体每周生成 1300 多个 PR。 Ramp 将 30%
4 MIN READ
2026年 4月 14日
NVIDIA NVbandwidth:测量 GPU 互连和显存性能的必备工具
在编写 CUDA 应用程序时,要编写出色的代码,您需要关注的最重要的一点是数据传输性能。这适用于单 GPU 和多 GPU 系统。
3 MIN READ
2026年 4月 11日
MiniMax M2.7 在 NVIDIA 平台上推进复杂 AI 应用的可扩展代理工作流程
MiniMax M2.7 的发布为流行的 MiniMax M2.7 模型增加了增强功能,该模型专为代理式线束以及推理、ML 研究工作流程、
2 MIN READ
2026年 4月 9日
使用 Slurm 在 Kubernetes 上运行大规模 GPU 工作负载
Slurm 是适用于 Linux 的开源集群管理和作业调度系统。它可以管理超过 65% 的 TOP500 系统 的作业调度。
3 MIN READ
2026年 4月 9日
使用约 30 行 Python 和 NVIDIA nvCOMP 降低检查点成本
训练 LLM 需要定期检查点。这些模型权重、优化器状态和梯度的完整快照将保存到存储中,以便在中断后恢复训练。在规模上,这些检查点变得庞大 (…
5 MIN READ
2026年 4月 7日
在机架级超级计算机上运行 AI 工作负载:从硬件到拓扑感知调度
采用 NVIDIA Blackwell 架构的 NVIDIA GB200 NVL72 和 NVIDIA GB300 NVL72…
4 MIN READ
2026年 4月 2日
使用批量模式 VC-6 和 NVIDIA Nsight 加速视觉 AI 工作流
在视觉 AI 系统中,模型吞吐量不断提高。周围的工作流阶段必须与时俱进,包括解码、预处理和 GPU 调度。在上一篇文章中,
3 MIN READ
2026年 4月 2日
为资本市场实现单位数微秒级延迟推理
在算法交易中,缩短对市场事件的响应时间至关重要。为了与高速电子市场保持同步,对延迟敏感的公司通常使用 FPGA 和 ASIC 等专用硬件。
3 MIN READ