精选

2026年 7月 27日

六种智能体线束功能可实现更高的模型性能

构建出色的 AI 智能体不仅仅是选择合适的模型。线束是围绕模型的架构。渲染上下文、执行动作、管理状态以及决定任务何时完成，

2 MIN READ

2026年 7月 21日

在 NVIDIA GB300 NVL72 上进行 MoE 预训练创下世界纪录

前沿模型预训练已融合多专家模型 (MoE) ，这从根本上改变了对大规模 AI 训练的限制。随着每 token 的计算量下降，

3 MIN READ

2026年 7月 21日

深入了解 NVIDIA Rubin GPU 架构：助力代理式 AI 时代

最初是离散 AI 模型训练和面向人类的聊天界面，后来演变为始终在线的 AI 工厂，致力于大规模生产智能。现在，

4 MIN READ

2026年 7月 21日

NVIDIA Vera CPU：专为实现代理式 AI 的最大单线程性能而打造的 Olympus Core

代理式 AI 将更多的关键执行路径转移到 CPU 上。智能体在沙盒中执行代码、调用工具、检索上下文、与数据库交互，以及分析结果，

3 MIN READ

2026年 7月 8日

为 NVIDIA Nemotron 3 Ultra 创建 LangChain 深度智能体线束配置文件以提高性能

代理式系统通常需要在准确性和成本之间做出权衡。性能最高的专有前沿模型和线束可提供最高的准确性，但成本高昂。微调是解决这一问题的一种方法。

3 MIN READ

2026年 7月 7日

NVIDIA Vera CPU 提升 AI 工厂吞吐量，加速代理式工作负载

代理式系统通过结合推理、工具使用、代码执行、检索、编排和结果处理的多步骤工作流，将模型推理转化为行动。随着这些系统在整个 AI 工厂中的扩展，

2 MIN READ

2026年 6月 23日

使用 DFlash 预测解码，在 NVIDIA Blackwell 上将推理性能提升高达 15 倍

随着 AI 系统从单轮交互转向协调的多智能体工作流，低延迟推理成为越来越重要。自回归 LLM 按顺序生成 token，

2 MIN READ

2026年 6月 16日

NVIDIA Blackwell 凭借业界领先的规模和性能超越 MLPerf 训练 6.0

NVIDIA 对 MLPerf Training v6.0 进行了彻底的测试，这是 MLCommons 联盟开发的最新版行业标准 AI…

3 MIN READ

2026年 6月 12日

NVIDIA 在首个代理式 AI 基准测试中实现了领先的代理式编码性能

AI 智能体从根本上改变了推理工作负载的复杂性。到目前为止，业界一直在努力定义用于衡量推理系统在这些条件下的性能的标准。

2 MIN READ

2026年 6月 12日

在 NVIDIA 加速基础设施上使用 MiniMax M3 部署长上下文推理和代理式工作流

随着企业 AI 采用的规模扩大，开发者越来越多地不得不将分散的工作流拼接在一起，即分别用于文本、视觉和代码的模型，从而导致复杂性增加、

1 MIN READ

2026年 6月 10日

在 NVIDIA 上运行 DiffusionGemma，实现开发者就绪型高吞吐量文本生成

构建实时 AI (例如聊天助手、copilot 和代理式工作流) 的开发者通常会受到词元-by-词元生成速度的限制。这限制了响应能力，

2 MIN READ

2026年 6月 4日

NVIDIA Nemotron 3 Ultra 为长时间运行的智能体提供更快、更高效的推理能力

单轮聊天机器人正在演变为长时间运行的智能体，这些智能体可以进行推理、维护上下文、使用工具，并在多轮中高效运行，从而完成复杂的工作流程。但是，

3 MIN READ

2026年 5月 31日

如何使用 NVIDIA Alpamayo 在闭环中对自动驾驶车辆模型进行后训练

开发自动驾驶车辆（AV）政策需要弥合训练与部署之间的一个重要差距。

2 MIN READ

2026年 5月 31日

借助 NVIDIA Cosmos 3 开发物理 AI 推理模型、世界模型和动作模型

物理 AI 系统必须先了解现实世界，然后才能在其中发挥作用。机器人、智能汽车和智能空间需要了解其环境中发生的情况，预测接下来可能发生的情况，

5 MIN READ

2026年 5月 27日

NVIDIA Dynamo Snapshot：面向 Kubernetes 上推理工作负载的快速启动

在生产环境中的推理部署里，需求会随时间波动，因此推理副本需要弹性扩缩容。然而，在 Kubernetes 上冷启动推理工作负载可能需要几分钟。

4 MIN READ

2026年 5月 26日

使用 NVIDIA CUDA Tile 在 C++ 中开发高性能 GPU 内核

开发者现在可以在现有的大型 C++ GPU 代码库中使用 NVIDIA CUDA Tile 编程，

6 MIN READ