最近文章

2026年 7月 15日

借助 AI 智能体更快地开发轻量级 USD 运行时

OpenUSD 是一个开放、可扩展的框架，可为物理 AI 提供通用场景描述语言。它使团队能够将 CAD 数据、

3 MIN READ

2026年 7月 15日

在 NVIDIA CUDA 13.3 中使用无带乘法构建更快的加密技术

15 年多来，x86 CPU 一直附带用于无携带乘法的专用硬件指令。它是一个小但却很棘手的基元，位于经过身份验证的加密、

3 MIN READ

2026年 7月 14日

排行榜上的经验教训：5000+ Kagglers 教我们如何改进 AI 推理

NVIDIA Nemotron 模型推理挑战赛邀请了 Kaggle 社区探讨一个重点问题：当每个人都从相同的开放模型、基准测试、

2 MIN READ

2026年 7月 14日

NVIDIA DGX Spark：端到端智能人才招聘解决方案，赋能企业发展

人才招聘是企业扩张与团队搭建的根基。随着数字行业人才竞争日趋白热化，企业传统招聘模式长期深陷三大核心痛点：海量简历人工筛选效率低下、

1 MIN READ

2026年 7月 13日

使用引导生成模型预测极端事件概率

在科学、工程和金融领域，许多最重要的风险来自低概率、高影响事件。使用强力蒙特卡罗采样 (使用随机抽取的输入重复运行模型以估计罕见结果的概率)…

2 MIN READ

2026年 7月 11日

如何评估用于现实世界部署的通用机器人策略

机器人基础模型取得了显著进展。当今的出色系统可以遵循自然语言指令来选取、放置、分类和操作各种物体。但是，随着这些模型的功能越来越强大，

3 MIN READ

2026年 7月 10日

借助主机卸载减少基于 JAX 的 LLM 训练中的高带宽内存瓶颈

在充分利用计算能力之前，大语言模型 (LLM) 训练工作负载越来越多地遇到 GPU 显存限制。模型权重、梯度、优化器状态、

3 MIN READ

2026年 7月 10日

NVIDIA CUDA 中的内核融合：优化内存流量并启动开销

针对 GPU 优化代码的方法有很多。在本文中，您将了解内核融合如何提高内存带宽并减少内核启动用度，

4 MIN READ

2026年 7月 10日

AI 模型协同设计：硬件友好型 LLM 设计

AI 性能可归结为三个维度：部署必须平衡这三者：如果响应速度缓慢，就会浪费高准确度；如果每个用户的体验滞后，则原始吞吐量就意味着微不足道。

5 MIN READ

2026年 7月 10日

借助 NVIDIA BioNeMo Agent Toolkit 加速端到端协同折叠性能

生物分子结构预测以及与 OpenFold3 等模型的联合折叠现已成为主流的大规模工作负载，为药物研发和蛋白质设计提供支持。

3 MIN READ

2026年 7月 9日

借助 NVIDIA NeMo 生成用于金融 AI 研究的合成数据

金融自然语言处理 (NLP) 的微调 LLM 受到有限且不平衡的数据的限制。现实世界的金融新闻过度代表收益和股票动态，而信用评级变化、

5 MIN READ

2026年 7月 9日

针对大规模分子动力学的 GPU 主动通信实用指南

分子动力学 (MD) 模拟是计算科学领域要求最严苛的工作负载之一。使用它们，研究人员可以非常详细地观察原子行为，从蛋白质折叠到药物和材料发现。

8 MIN READ

2026年 7月 8日

在 NVIDIA GB200 NVL72 上使用 GPU 加速的 Presto 运行低延迟分析工作负载

Presto 是一个开源分布式 SQL 引擎，可对超大型数据集快速运行交互式查询。在 NVIDIA GPU 上，

3 MIN READ

2026年 7月 7日

NVIDIA Vera CPU 提升 AI 工厂吞吐量，加速代理式工作负载

代理式系统通过结合推理、工具使用、代码执行、检索、编排和结果处理的多步骤工作流，将模型推理转化为行动。随着这些系统在整个 AI 工厂中的扩展，

2 MIN READ

2026年 7月 7日

使用 NVIDIA Isaac GR00T 开发端到端人形机器人策略

随着越来越多的团队从人形机器人启动转向特定任务的技能开发，对可重复开发工作流的需求也与日俱增。构建人形机器人仍然十分复杂，

3 MIN READ

2026年 7月 7日

使用 NVIDIA Nemotron 构建用于工业警报管理的分析 AI 智能体

工业机械产生的警报数量超过技术人员能够进行分类的数量。对于每个需要跟进的重要警报，技术人员都会提取历史背景，确定正确的程序，

2 MIN READ