智能体/生成式 AI

2026年 6月 29日

如何治理企业 AI 工厂中的自主智能体

AI 智能体正在迅速超越聊天。它们检查代码、运行测试、阅读文档、搜索知识库、查询内部系统，并代表用户运行几个小时。这样不仅可以提高工作效率，

1 MIN READ

2026年 6月 26日

在 Oracle 云基础设施上部署生产就绪型 NVIDIA AI-Q Blueprint

在过去两年中，AI 智能体发生了巨大变化。第一个问题一次只能回答一个问题。接下来是多轮聊天，模型可以在会议中保留一些上下文。如今，

3 MIN READ

2026年 6月 26日

使用 NVIDIA Model Optimizer 创建 NVIDIA Nemotron 3 Ultra NVFP4 Checkpoint

随着上下文窗口变长，高效移动大型模型权重对性能至关重要。解决此问题的常用方法是量化，这是一种将模型权重压缩为较小数据格式的优化技术。

6 MIN READ

2026年 6月 25日

使用 NVIDIA TensorRT 和多设备推理支持，跨多个 GPU 扩展 AI 推理

生成式 AI 工作负载的显存和计算预算正迅速超出单个 GPU。对于构建媒体生成工作流的推理开发者而言，

4 MIN READ

2026年 6月 23日

使用 DFlash 预测解码，在 NVIDIA Blackwell 上将推理性能提升高达 15 倍

随着 AI 系统从单轮交互转向协调的多智能体工作流，低延迟推理成为越来越重要。自回归 LLM 按顺序生成 token，

2 MIN READ

2026年 6月 22日

电信公司如何利用代理式 AI 构建自主网络

电信运营商正在跨网络运营、客户服务和后台工作流采用 AI，但大多数运营商仍处于自主化的早期阶段。例如，在网络运营中，

2 MIN READ

2026年 6月 22日

借助 DAQIRI 实现用于高速数据采集的实时 AI

当 AlphaFold2 在 2020 年彻底改变药物研发时，

3 MIN READ

2026年 6月 22日

深入了解适用于机器人的 NVIDIA Halos：适用于物理 AI 的全栈功能安全系统

物理 AI—即在工厂、仓库、医院和家中与人类自主协作的机器人——的到来比大多数人预期的要快。随着空间变得越来越非结构化，机器人走出牢笼，

4 MIN READ

2026年 6月 16日

使用 NVIDIA XR AI 为 AR 眼镜和 XR 设备构建 AI 智能体

为 AR 眼镜和可穿戴设备打造的开发者面临着基础设施缺口。硬件已准备就绪，但要打造 AI 体验，需要集成实时摄像头和麦克风流、

2 MIN READ

2026年 6月 16日

NVIDIA Blackwell 凭借业界领先的规模和性能超越 MLPerf 训练 6.0

NVIDIA 对 MLPerf Training v6.0 进行了彻底的测试，这是 MLCommons 联盟开发的最新版行业标准 AI…

3 MIN READ

2026年 6月 15日

借助高级融合内核提高 MoE 训练吞吐量

多专家模型 (MoE) 已迅速成为现代大规模 AI 系统的基础组件。它们之所以得到广泛采用，是因为它们能够显著提高模型容量，

2 MIN READ

2026年 6月 12日

NVIDIA 在首个代理式 AI 基准测试中实现了领先的代理式编码性能

AI 智能体从根本上改变了推理工作负载的复杂性。到目前为止，业界一直在努力定义用于衡量推理系统在这些条件下的性能的标准。

2 MIN READ

2026年 6月 12日

在 NVIDIA 加速基础设施上使用 MiniMax M3 部署长上下文推理和代理式工作流

随着企业 AI 采用的规模扩大，开发者越来越多地不得不将分散的工作流拼接在一起，即分别用于文本、视觉和代码的模型，从而导致复杂性增加、

1 MIN READ

2026年 6月 11日

借助 NVIDIA Quantum InfiniBand 实现一键式多租户安全

NVIDIA Quantum InfiniBand 现可在 Unified Fabric Manager (UFM)…

2 MIN READ

2026年 6月 10日

在 NVIDIA 上运行 DiffusionGemma，实现开发者就绪型高吞吐量文本生成

构建实时 AI (例如聊天助手、copilot 和代理式工作流) 的开发者通常会受到词元-by-词元生成速度的限制。这限制了响应能力，

2 MIN READ

2026年 6月 9日

借助 NVIDIA DGX Spark Enterprise 可管理性，大规模控制 AI 基础设施的生命周期

随着 AI 基础设施的扩展，企业对运营成熟度的期望与日俱增。组织期望这些系统具备可配置、可观察、安全且可大规模管理的特点，

1 MIN READ