精选

2026年 7月 23日

使用 NVIDIA OptiX 工具包调试光线追踪应用

NVIDIA OptiX 光线追踪引擎是一种应用框架，可在 GPU 上实现出色的光线追踪性能。

2 MIN READ

2026年 7月 23日

借助 Prime Intellect Lab，只需几分钟即可开始自定义 NVIDIA Nemotron 3 Nano

自定义使开发者能够采用通用模型，并根据用例、领域、语言等对其进行定制。然而，定制化也带来了一些挑战。它需要基础设施、

4 MIN READ

2026年 7月 22日

让长时间运行的 NVIDIA TensorRT 引擎在 Python 或 C++ 中构建可观察和可取消

构建 TensorRT 引擎可能需要几秒钟到几分钟的时间。大型强类型模型、深度策略搜索和全新 GPU SKU 上的冷定时缓存可能会让开发者、

4 MIN READ

2026年 7月 21日

在 NVIDIA GB300 NVL72 上进行 MoE 预训练创下世界纪录

前沿模型预训练已融合多专家模型 (MoE) ，这从根本上改变了对大规模 AI 训练的限制。随着每 token 的计算量下降，

3 MIN READ

2026年 7月 21日

深入了解 NVIDIA Rubin GPU 架构：助力代理式 AI 时代

最初是离散 AI 模型训练和面向人类的聊天界面，后来演变为始终在线的 AI 工厂，致力于大规模生产智能。现在，

4 MIN READ

2026年 7月 21日

NVIDIA Vera CPU：专为实现代理式 AI 的最大单线程性能而打造的 Olympus Core

代理式 AI 将更多的关键执行路径转移到 CPU 上。智能体在沙盒中执行代码、调用工具、检索上下文、与数据库交互，以及分析结果，

3 MIN READ

2026年 7月 15日

在 NVIDIA CUDA 13.3 中使用无带乘法构建更快的加密技术

15 年多来，x86 CPU 一直附带用于无携带乘法的专用硬件指令。它是一个小但却很棘手的基元，位于经过身份验证的加密、

3 MIN READ

2026年 7月 11日

如何评估用于现实世界部署的通用机器人策略

机器人基础模型取得了显著进展。当今的出色系统可以遵循自然语言指令来选取、放置、分类和操作各种物体。但是，随着这些模型的功能越来越强大，

3 MIN READ

2026年 7月 9日

针对大规模分子动力学的 GPU 主动通信实用指南

分子动力学 (MD) 模拟是计算科学领域要求最严苛的工作负载之一。使用它们，研究人员可以非常详细地观察原子行为，从蛋白质折叠到药物和材料发现。

8 MIN READ

2026年 7月 8日

为 NVIDIA Nemotron 3 Ultra 创建 LangChain 深度智能体线束配置文件以提高性能

代理式系统通常需要在准确性和成本之间做出权衡。性能最高的专有前沿模型和线束可提供最高的准确性，但成本高昂。微调是解决这一问题的一种方法。

3 MIN READ

2026年 7月 8日

在 NVIDIA GB200 NVL72 上使用 GPU 加速的 Presto 运行低延迟分析工作负载

Presto 是一个开源分布式 SQL 引擎，可对超大型数据集快速运行交互式查询。在 NVIDIA GPU 上，

3 MIN READ

2026年 7月 7日

NVIDIA Vera CPU 提升 AI 工厂吞吐量，加速代理式工作负载

代理式系统通过结合推理、工具使用、代码执行、检索、编排和结果处理的多步骤工作流，将模型推理转化为行动。随着这些系统在整个 AI 工厂中的扩展，

2 MIN READ

2026年 7月 7日

使用 NVIDIA Isaac GR00T 开发端到端人形机器人策略

随着越来越多的团队从人形机器人启动转向特定任务的技能开发，对可重复开发工作流的需求也与日俱增。构建人形机器人仍然十分复杂，

3 MIN READ

2026年 7月 7日

借助 AI 原生 RAN 和 NVIDIA AI Aerial 更大限度地提高频谱效率

Spectrum 是无线通信领域最宝贵的资产之一。在过去 30 年里，美国的电信运营商为获取无线频谱花费了超过 2400 亿美元。

3 MIN READ

2026年 7月 7日

使用 NVIDIA Nemotron 构建用于工业警报管理的分析 AI 智能体

工业机械产生的警报数量超过技术人员能够进行分类的数量。对于每个需要跟进的重要警报，技术人员都会提取历史背景，确定正确的程序，

2 MIN READ

2026年 7月 6日

使用 Noniform Tensor Parallelism 提高大规模 LLM 训练的效率

大规模训练 LLM 会带来独特的基础架构挑战，尤其是在作业跨越数千个 GPU 并长时间运行的情况下。这些作业运行的时间越长，

2 MIN READ