深入了解

2026年 7月 13日

使用引导生成模型预测极端事件概率

在科学、工程和金融领域，许多最重要的风险来自低概率、高影响事件。使用强力蒙特卡罗采样 (使用随机抽取的输入重复运行模型以估计罕见结果的概率)…

2 MIN READ

2026年 7月 11日

如何评估用于现实世界部署的通用机器人策略

机器人基础模型取得了显著进展。当今的出色系统可以遵循自然语言指令来选取、放置、分类和操作各种物体。但是，随着这些模型的功能越来越强大，

3 MIN READ

2026年 7月 10日

借助主机卸载减少基于 JAX 的 LLM 训练中的高带宽内存瓶颈

在充分利用计算能力之前，大语言模型 (LLM) 训练工作负载越来越多地遇到 GPU 显存限制。模型权重、梯度、优化器状态、

3 MIN READ

2026年 7月 10日

AI 模型协同设计：硬件友好型 LLM 设计

AI 性能可归结为三个维度：部署必须平衡这三者：如果响应速度缓慢，就会浪费高准确度；如果每个用户的体验滞后，则原始吞吐量就意味着微不足道。

5 MIN READ

2026年 7月 8日

在 NVIDIA GB200 NVL72 上使用 GPU 加速的 Presto 运行低延迟分析工作负载

Presto 是一个开源分布式 SQL 引擎，可对超大型数据集快速运行交互式查询。在 NVIDIA GPU 上，

3 MIN READ

2026年 7月 7日

NVIDIA Vera CPU 提升 AI 工厂吞吐量，加速代理式工作负载

代理式系统通过结合推理、工具使用、代码执行、检索、编排和结果处理的多步骤工作流，将模型推理转化为行动。随着这些系统在整个 AI 工厂中的扩展，

2 MIN READ

2026年 7月 7日

借助 AI 原生 RAN 和 NVIDIA AI Aerial 更大限度地提高频谱效率

Spectrum 是无线通信领域最宝贵的资产之一。在过去 30 年里，美国的电信运营商为获取无线频谱花费了超过 2400 亿美元。

3 MIN READ

2026年 7月 6日

使用 Noniform Tensor Parallelism 提高大规模 LLM 训练的效率

大规模训练 LLM 会带来独特的基础架构挑战，尤其是在作业跨越数千个 GPU 并长时间运行的情况下。这些作业运行的时间越长，

2 MIN READ

2026年 7月 2日

基于硬件的 AI 安全性不会拖慢您的速度

AI 改变了组织的运营方式，推动了前所未有的生产力和创新水平。但是，数据隐私、主权以及如何保护使用中的数据，

2 MIN READ

2026年 7月 1日

掌握代理式技术：AI 智能体强化学习

强化学习 (RL) 是调整语言模型的核心，从 AI 助手中的人类反馈强化学习 (RLHF) 到用于推理和智能体任务的较新的具有可验证奖励…

3 MIN READ

2026年 7月 1日

NVIDIA BlueField DPU：助力 AI 云兼顾效率与可信

随着大模型和高性能 AI 业务全面上云，用户的核心诉求正在从“有没有算力”转向“算力是否可控、是否隔离可信、能否高效调度”。

1 MIN READ

2026年 6月 30日

使用 NVIDIA GQE 设计 GPU 加速的查询引擎

GPU 加速的查询引擎通常会受到内存和 I/ O 带宽的限制。NVIDIA 硬件的进步 (包括高带宽显存 (HBM) 、

4 MIN READ

2026年 6月 24日

加速 NVIDIA GPU 上用于物理 AI 应用的 BEV 池化

鸟瞰图 (BEV) 感知是智能汽车 (智能汽车) 、机器人和空间 AI 系统日益常见的设计模式。

5 MIN READ

2026年 6月 22日

电信公司如何利用代理式 AI 构建自主网络

电信运营商正在跨网络运营、客户服务和后台工作流采用 AI，但大多数运营商仍处于自主化的早期阶段。例如，在网络运营中，

2 MIN READ

2026年 6月 22日

借助 DAQIRI 实现用于高速数据采集的实时 AI

当 AlphaFold2 在 2020 年彻底改变药物研发时，

3 MIN READ

2026年 6月 22日

深入了解适用于机器人的 NVIDIA Halos：适用于物理 AI 的全栈功能安全系统

物理 AI—即在工厂、仓库、医院和家中与人类自主协作的机器人——的到来比大多数人预期的要快。随着空间变得越来越非结构化，机器人走出牢笼，

4 MIN READ