CUDA

2026年 7月 23日

使用 NVIDIA OptiX 工具包调试光线追踪应用

NVIDIA OptiX 光线追踪引擎是一种应用框架，可在 GPU 上实现出色的光线追踪性能。

2 MIN READ

2026年 7月 15日

在 NVIDIA CUDA 13.3 中使用无带乘法构建更快的加密技术

15 年多来，x86 CPU 一直附带用于无携带乘法的专用硬件指令。它是一个小但却很棘手的基元，位于经过身份验证的加密、

3 MIN READ

2026年 7月 10日

NVIDIA CUDA 中的内核融合：优化内存流量并启动开销

针对 GPU 优化代码的方法有很多。在本文中，您将了解内核融合如何提高内存带宽并减少内核启动用度，

4 MIN READ

2026年 7月 10日

借助 NVIDIA BioNeMo Agent Toolkit 加速端到端协同折叠性能

生物分子结构预测以及与 OpenFold3 等模型的联合折叠现已成为主流的大规模工作负载，为药物研发和蛋白质设计提供支持。

3 MIN READ

2026年 7月 7日

使用 NVIDIA Nemotron 构建用于工业警报管理的分析 AI 智能体

工业机械产生的警报数量超过技术人员能够进行分类的数量。对于每个需要跟进的重要警报，技术人员都会提取历史背景，确定正确的程序，

2 MIN READ

2026年 6月 30日

使用 NVIDIA Nsight 开发者工具优化神经重建工作流

NVIDIA Omniverse NuRec 是一种神经重建工作流，

3 MIN READ

2026年 6月 24日

加速 NVIDIA GPU 上用于物理 AI 应用的 BEV 池化

鸟瞰图 (BEV) 感知是智能汽车 (智能汽车) 、机器人和空间 AI 系统日益常见的设计模式。

5 MIN READ

2026年 6月 23日

使用 NVIDIA BioNeMo Agent Toolkit 打造适用于生命科学发现的 AI 科学家

AI 科学家正在成为科学计算的新界面。这些智能体可以阅读论文、编写代码、生成假设、调用 API、检查文件并对结果进行迭代。

2 MIN READ

2026年 6月 22日

CCCL 运行时：适用于 CUDA 的现代 C++ 运行时

NVIDIA CUDA 核心计算库 (CCCL) 可为 CUDA 开发者提供令人愉悦且高效的 C++ 和 Python 抽象。它具有以下特性：

3 MIN READ

2026年 6月 16日

使用 NVIDIA XR AI 为 AR 眼镜和 XR 设备构建 AI 智能体

为 AR 眼镜和可穿戴设备打造的开发者面临着基础设施缺口。硬件已准备就绪，但要打造 AI 体验，需要集成实时摄像头和麦克风流、

2 MIN READ

2026年 6月 16日

构建您自己的金融智能交易基础模型

现代金融网络上的每一次刷卡、转账和付款都会对人类行为模式进行编码。事务数据是企业掌握的最丰富的信号之一。然而，

3 MIN READ

2026年 6月 16日

如何优化基于 Transformer 的模型以进行低精度训练

Transformer 架构是许多现代大型语言和生成式 AI 模型的支柱。随着这些模型规模的扩大，

3 MIN READ

2026年 6月 16日

NVIDIA Blackwell 凭借业界领先的规模和性能超越 MLPerf 训练 6.0

NVIDIA 对 MLPerf Training v6.0 进行了彻底的测试，这是 MLCommons 联盟开发的最新版行业标准 AI…

3 MIN READ

2026年 6月 15日

借助高级融合内核提高 MoE 训练吞吐量

多专家模型 (MoE) 已迅速成为现代大规模 AI 系统的基础组件。它们之所以得到广泛采用，是因为它们能够显著提高模型容量，

2 MIN READ

2026年 6月 1日

在 NVIDIA JetPack 7.2 中部署具有高显存效率的边缘代理就绪型 AI

随着 AI 智能体从数字世界转向物理环境，他们可以轻松使用 NVIDIA Jetson，通过优化的内存和性能加速现实世界的部署。

3 MIN READ

2026年 5月 26日

借助 NVIDIA CompileIQ 自动调整功能提升内核性能

NVIDIA CompileIQ 解决了性能工程中最棘手的问题之一：找到为特定工作负载解锁最佳性能的编译器选项。想象一下，

3 MIN READ