常规

2026年 6月 4日

NVIDIA Nemotron 3 Ultra 为长时间运行的智能体提供更快、更高效的推理能力

单轮聊天机器人正在演变为长时间运行的智能体，这些智能体可以进行推理、维护上下文、使用工具，并在多轮中高效运行，从而完成复杂的工作流程。但是，

3 MIN READ

2026年 6月 2日

借助 Hermes 智能体和 NVIDIA NemoClaw 部署自进化智能体，以更快、更安全地进行研究

AI 智能体是一种强大的工具，可用于合成数据，从而加速研究、汇总信息，并帮助团队更快地做出决策。但是，

2 MIN READ

2026年 6月 1日

在 NVIDIA JetPack 7.2 中部署具有高显存效率的边缘代理就绪型 AI

随着 AI 智能体从数字世界转向物理环境，他们可以轻松使用 NVIDIA Jetson，通过优化的内存和性能加速现实世界的部署。

3 MIN READ

2026年 6月 1日

在 NVIDIA DGX Spark 上使用更快的模型和多节点集群运行本地 AI 智能体

自主、长期运行的 AI 智能体的兴起带来了一种新型计算需求，即维护大型上下文窗口、生成并发子智能体，以及在不依赖云的情况下持续迭代的任务。

2 MIN READ

2026年 5月 31日

借助 NVIDIA Cosmos 3 开发物理 AI 推理模型、世界模型和动作模型

物理 AI 系统必须先了解现实世界，然后才能在其中发挥作用。机器人、智能汽车和智能空间需要了解其环境中发生的情况，预测接下来可能发生的情况，

5 MIN READ

2026年 5月 31日

借助 NVIDIA DOCA 芯片级安全，推进代理式 AI 的 AI 基础设施建设

AI 时代正在催生一种新型基础设施：AI 工厂。AI 工厂能将数据转化为智能，赋能规模空前的自主AI 智能体。借助加速计算，

3 MIN READ

2026年 5月 29日

DynoSim：模拟帕累托前沿

现代 LLM 服务难以调优，因为每一次部署都是一组相互作用的选择堆栈：模型后端、张量并行形状、prefill/decode 拆分、

3 MIN READ

2026年 5月 29日

如何使用 NVIDIA MCG 工具包自动生成 AI 模型文档

随着 AI 模型日益复杂，并且在包括加州 AB-2013 和欧盟《人工智能法案》在内的框架下监管审查不断加强，

2 MIN READ

2026年 5月 27日

NVIDIA Dynamo Snapshot：面向 Kubernetes 上推理工作负载的快速启动

在生产环境中的推理部署里，需求会随时间波动，因此推理副本需要弹性扩缩容。然而，在 Kubernetes 上冷启动推理工作负载可能需要几分钟。

4 MIN READ

2026年 5月 26日

借助 NVIDIA CompileIQ 自动调整功能提升内核性能

NVIDIA CompileIQ 解决了性能工程中最棘手的问题之一：找到为特定工作负载解锁最佳性能的编译器选项。想象一下，

3 MIN READ

2026年 5月 26日

使用 NVIDIA CUDA Tile 在 C++ 中开发高性能 GPU 内核

开发者现在可以在现有的大型 C++ GPU 代码库中使用 NVIDIA CUDA Tile 编程，

6 MIN READ

2026年 5月 26日

NVIDIA CUDA 13.3 通过 C++ 中的平铺式编程、编译器自动调整和 Python 更新来增强 GPU 开发

NVIDIA CUDA 13.3 为整个 CUDA 生态系统的开发者带来了新功能和性能优化。通过在 C++ 中引入 NVIDIA CUDA…

4 MIN READ

2026年 5月 21日

实时了解跨 Kubernetes 集群的 GPU 使用情况

要更大限度地发挥 AI 基础设施的价值，需要深入了解 GPU 利用率。然而，许多在 Kubernetes 上运行 AI…

2 MIN READ

2026年 5月 21日

借助 Slurm 拓扑感知型作业调度功能，在 NVIDIA GB200 NVL72 上实现百万兆级性能

随着AI模型的规模和复杂性持续提升，要充分发挥现代加速基础设施的性能，关键在于如何合理分配工作负载以及硬件的部署方式。

3 MIN READ

2026年 5月 21日

在电信 AI 工厂构建词元+ Metered AI 服务

全球各地的电信公司正基于主权AI工厂基于NVIDIA云合作伙伴（NCP）参考架构，建设，使政府、企业和初创公司能够以适当的控制力、

3 MIN READ

2026年 5月 20日

掌握智能体技术：AI 智能体定制

自主 AI 智能体正承担着企业中的各种任务：规划物流车队路线、分类支持工单、生成代码以及编排多步骤工作流。

3 MIN READ