精选
2026年 6月 10日
在 NVIDIA 上运行 DiffusionGemma,实现开发者就绪型高吞吐量文本生成
构建实时 AI (例如聊天助手、copilot 和代理式工作流) 的开发者通常会受到词元-by-词元生成速度的限制。这限制了响应能力,
2 MIN READ
2026年 6月 4日
NVIDIA Nemotron 3 Ultra 为长时间运行的智能体提供更快、更高效的推理能力
单轮聊天机器人正在演变为长时间运行的智能体,这些智能体可以进行推理、维护上下文、使用工具,并在多轮中高效运行,从而完成复杂的工作流程。 但是,
3 MIN READ
2026年 5月 31日
如何使用 NVIDIA Alpamayo 在闭环中对自动驾驶车辆模型进行后训练
开发自动驾驶车辆(AV)政策需要弥合训练与部署之间的一个重要差距。
2 MIN READ
2026年 5月 31日
借助 NVIDIA Cosmos 3 开发物理 AI 推理模型、世界模型和动作模型
物理 AI 系统必须先了解现实世界,然后才能在其中发挥作用。机器人、智能汽车和智能空间需要了解其环境中发生的情况,预测接下来可能发生的情况,
5 MIN READ
2026年 5月 27日
NVIDIA Dynamo Snapshot:面向 Kubernetes 上推理工作负载的快速启动
在生产环境中的推理部署里,需求会随时间波动,因此推理副本需要弹性扩缩容。然而,在 Kubernetes 上冷启动推理工作负载可能需要几分钟。
4 MIN READ
2026年 5月 26日
使用 NVIDIA CUDA Tile 在 C++ 中开发高性能 GPU 内核
开发者现在可以在现有的大型 C++ GPU 代码库中使用 NVIDIA CUDA Tile 编程,
6 MIN READ
2026年 5月 26日
NVIDIA CUDA 13.3 通过 C++ 中的平铺式编程、编译器自动调整和 Python 更新来增强 GPU 开发
NVIDIA CUDA 13.3 为整个 CUDA 生态系统的开发者带来了新功能和性能优化。通过在 C++ 中引入 NVIDIA CUDA…
4 MIN READ
2026年 5月 14日
NVIDIA Vera Rubin 平台如何解决代理式 AI 的纵向扩展问题
代理式推理通过引入非确定性轨迹(即AI智能体在执行任务时生成的动作、观察结果和决策),从根本上改变了推理工作负载的运行时特性。
2 MIN READ
2026年 5月 8日
流式传输词元和工具:NVIDIA Dynamo 中的多回合代理线束支持
智能体交换必须保留结构化交互:助手通过一次或多次工具调用进行交错推理,随后用户轮流将相应的工具结果返回至模型上下文。
4 MIN READ
2026年 5月 5日
借助极致协同设计构建日益复杂的代理式系统
生成式 AI 具有爆炸性的第一章由发送请求的人类和响应的模型定义。代理式章节有所不同。 智能体不会遵循预先确定的动作序列。它们可以调用工具,
3 MIN READ
2026年 4月 28日
NVIDIA Nemotron 3 Nano Omni 在单个高效开放模型中助力多模态智能体推理
代理式系统通常会在单个感知到动作循环中跨屏幕、文档、音频、视频和文本进行推理。但是,它们仍然依赖于碎片化的模型链,即视觉、
3 MIN READ
2026年 4月 24日
使用 NVIDIA Blackwell 和 GPU 加速端点构建 DeepSeek V4
DeepSeek 刚刚发布了第四代旗舰模型,推出 DeepSeek-V4-Pro 和 DeepSeek-V4-Flash 两款产品,
2 MIN READ
2026年 4月 17日
使用 OpenClaw 和 NVIDIA NemoClaw 构建更安全、始终运行的本地 AI 智能体
智能体正在从问答系统发展为长期运行的自主助手,可读取文件、调用 API 并驱动多步骤工作流。但是,
3 MIN READ
2026年 4月 11日
MiniMax M2.7 在 NVIDIA 平台上推进复杂 AI 应用的可扩展代理工作流程
MiniMax M2.7 的发布为流行的 MiniMax M2.7 模型增加了增强功能,该模型专为代理式线束以及推理、ML 研究工作流程、
2 MIN READ
2026年 4月 2日
借助 Gemma 4,让 AI 更贴近边缘和设备端
随着最新 Gemma 4 多模态和多语言模型的推出,Gemmaverse 得以扩展,
2 MIN READ
2026年 4月 1日
NVIDIA Extreme Co-Design 带来 MLPerf 推理新纪录
共同设计的硬件、软件和模型是提供更高 AI 工厂吞吐量和更低词元成本的关键。测量这一点远远超出了峰值芯片规格。
3 MIN READ