NVIDIA 开发者博客

数据科学

控制 NVIDIA CCCL 中的浮点确定性
智能体/生成式 AI

在 NVIDIA CUDA Tile 中调整 Flash Attention 以实现峰值性能
智能体/生成式 AI

NVIDIA Blackwell 刷新金融领域大模型推理 STAC-AI 历史纪录
数据科学

cuTile.jl 为 Julia 带来基于 NVIDIA CUDA Tile 的编程
智能体/生成式 AI

如何利用编码智能体大幅降低游戏运行时的推理成本

控制 NVIDIA CCCL 中的浮点确定性

如果使用相同的输入数据进行多次运行时能够产生完全一致的逐位计算结果，则该计算被称为确定性计算。这看似简单，但在实际中却难以实现，

2 MIN READ

2026年 3月 5日

在 NVIDIA CUDA Tile 中调整 Flash Attention 以实现峰值性能

在本文中，我们将深入探讨现代 AI 中至关重要的工作负载之一：Flash Attention，您将了解：环境要求：

9 MIN READ

2026年 3月 5日

NVIDIA Blackwell 刷新金融领域大模型推理 STAC-AI 历史纪录

大语言模型（LLM）通过精密分析大量非结构化数据，生成切实可行的交易见解，正在重塑金融交易格局。这些先进的 AI 系统能够处理金融新闻、

3 MIN READ

2026年 3月 3日

cuTile.jl 为 Julia 带来基于 NVIDIA CUDA Tile 的编程

NVIDIA CUDA Tile 是 NVIDIA CUDA 编程的一项重要新增功能，可自动访问 Tensor Core 和其他专用硬件。

2 MIN READ

2026年 3月 3日

如何利用编码智能体大幅降低游戏运行时的推理成本

NVIDIA ACE 是一套用于构建游戏 AI 智能体的技术。ACE 为游戏中角色的各个部分（从语音到智能，

2 MIN READ

2026年 2月 28日

开发者可用 5 款全新数字孪生产品构建 6G 网络

要实现 6G，电信行业必须应对一项根本性挑战：如何设计、训练并验证那些过于复杂而无法在现实世界中进行测试的 AI 原生网络。

2 MIN READ

2026年 2月 28日

使用 NVIDIA NeMo 构建电信自主网络推理模型

自主网络正迅速成为电信行业的重点任务之一。根据最新的 NVIDIA 电信行业 AI 现状报告，65% 的运营商表示 AI 正在推动网络自动化，

2 MIN READ

2026年 2月 27日

基于 NVIDIA GPU 加速端点，使用千问3.5 VLM 开发原生多模态智能体

阿里巴巴推出了全新开源千问3.5 系列，专为构建原生多模态智能体而设计。该系列的首个模型是一款总参数为 397B、

1 MIN READ

增强现实/虚拟现实

查看全部

2025年 10月 22日

使用 NVIDIA Nemotron 构建您自己的 Bash 计算机使用代理，只需一小时

如果您能够通过自然语言与计算机通信，让计算机在 Bash 终端中执行任务，而无需手动编写任何命令，该怎么办？

5 MIN READ

2025年 5月 18日

聚焦：Perfect Corp. 利用 NVIDIA TensorRT 和 NVENC 实现个性化的数字化美妆体验

增强现实 (AR) 和 AI 通过提供从虚拟试用到 AI 驱动的造型推荐等超个性化体验，正在彻底改变美妆和时尚行业。

1 MIN READ

2025年 5月 6日

借助 NVIDIA RTX PRO Blackwell 台式机 GPU 实现 Rivian 新一代XR 设计

对于不断突破 XR 界限的专业人士而言，打造身临其境的高保真体验始终充满挑战。在渲染大型数据集和驱动最新的超高分辨率高级 XR 头显设备时，

2 MIN READ

2025年 3月 5日

借助 NVIDIA Omniverse 将 AR 体验串流到 Apple iPad

最近在 MWC 巴塞罗那宣布，开发者现在可以将使用 NVIDIA Omniverse 构建的增强现实（AR）体验流式传输到 Apple…

1 MIN READ

2025年 2月 24日

在 NVIDIA 视频编解码器 SDK 13.0 中使用 MV-HEVC 启用立体和 3D 视图

NVIDIA 宣布在最新的 NVIDIA 视频编解码器 SDK 版本 13.0 中实施多视图高效视频编码 (MV-HEVC) 编码器。

2 MIN READ

2025年 1月 6日

利用 NVIDIA Omniverse 空间流，在 XR 中体验数字孪生技术

空间计算体验正在转变我们与数据的交互方式，通过扩展现实 (XR) 和数字孪生等技术连接物理和数字世界。

2 MIN READ

2024年 10月 24日

利用 NVIDIA Morpheus 加速警报分流和 LLM 代理强化安全运营中心

安全运营中心（SOC）分析师每天都会收到大量传入的安全警报。为了确保其组织的持续安全，他们的任务是仔细检查传入的噪音，分拣出误报，

1 MIN READ

2024年 10月 22日

多代理 AI 和 GPU 驱动的声音转文本技术创新

自动音频字幕 (Automated Audio Captioning) 任务的核心是从音频输入中生成自然语言描述。鉴于输入 (音频) 和输出…

2 MIN READ

数据科学

查看全部

2026年 2月 18日

NVIDIA 极致软硬件协同设计如何助力 Sarvam AI 主权模型实现惊人推理性能跃升

随着全球人工智能采用的加速，开发者面临日益严峻的挑战：如何提供符合现实世界延迟和成本要求的大语言模型（LLM）性能。

4 MIN READ

2026年 2月 18日

登顶 GPU 内核排行榜：借助 NVIDIA CUDA.compute 实现卓越性能

Python 在符合人体工程学的机器学习领域占据主导地位，但编写真正高效的 GPU 代码历来需要使用 C++ 编写自定义内核，

2 MIN READ

2026年 2月 18日

在 NVIDIA Run:ai 中利用 GPU 解锁大规模 Token 吞吐能力

随着 AI 工作负载的扩展，实现高吞吐量、高效资源利用和可预测的延迟变得愈发关键。 NVIDIA Run:ai 通过智能调度和动态 GPU…

4 MIN READ

2026年 2月 4日

如何使用 Nemotron 为 RAG 构建文档处理流程

如果您的 AI 智能体能够像读取文本文件一样轻松地即时解析复杂的 PDF、提取嵌套表格并“查看”图表中的数据，该怎么办？

3 MIN READ

2026年 1月 30日

借助 CUDA Tile IR 后端推进 OpenAI Triton 的 GPU 编程

NVIDIA CUDA Tile 是基于 GPU 的编程模型，其设计目标是为 NVIDIA Tensor Cores 提供可移植性，

2 MIN READ

2026年 1月 26日

如何使用 NVIDIA Earth-2 解锁粗略气候投影的局部细节

全球气候模型擅长大局把握，但飓风和台风等局部极端气候现象往往在细节中被忽略。这些现象依然存在，只需借助合适的工具，

3 MIN READ

2026年 1月 14日

如何在 NVIDIA CUDA Tile 中编写高性能矩阵乘法

本博文是系列课程的一部分，旨在帮助开发者学习 NVIDIA CUDA Tile 编程，掌握构建高性能 GPU 内核的方法，

5 MIN READ

2026年 1月 13日

了解 NVIDIA cuOpt 如何通过原始启发式算法加速混合整数优化

NVIDIA cuOpt 是一款 GPU 加速的优化引擎，旨在为大规模复杂决策问题提供高效、高质量的解决方案。混合整数规划（MIP）…

2 MIN READ

NVIDIA 技术博客

控制 NVIDIA CCCL 中的浮点确定性

在 NVIDIA CUDA Tile 中调整 Flash Attention 以实现峰值性能

NVIDIA Blackwell 刷新金融领域大模型推理 STAC-AI 历史纪录

cuTile.jl 为 Julia 带来基于 NVIDIA CUDA Tile 的编程

如何利用编码智能体大幅降低游戏运行时的推理成本

最近

控制 NVIDIA CCCL 中的浮点确定性

在 NVIDIA CUDA Tile 中调整 Flash Attention 以实现峰值性能

NVIDIA Blackwell 刷新金融领域大模型推理 STAC-AI 历史纪录

cuTile.jl 为 Julia 带来基于 NVIDIA CUDA Tile 的编程

如何利用编码智能体大幅降低游戏运行时的推理成本

开发者可用 5 款全新数字孪生产品构建 6G 网络

使用 NVIDIA NeMo 构建电信自主网络推理模型

基于 NVIDIA GPU 加速端点，使用千问3.5 VLM 开发原生多模态智能体

增强现实/虚拟现实

使用 NVIDIA Nemotron 构建您自己的 Bash 计算机使用代理，只需一小时

聚焦：Perfect Corp. 利用 NVIDIA TensorRT 和 NVENC 实现个性化的数字化美妆体验

借助 NVIDIA RTX PRO Blackwell 台式机 GPU 实现 Rivian 新一代XR 设计

借助 NVIDIA Omniverse 将 AR 体验串流到 Apple iPad

在 NVIDIA 视频编解码器 SDK 13.0 中使用 MV-HEVC 启用立体和 3D 视图

利用 NVIDIA Omniverse 空间流，在 XR 中体验数字孪生技术

利用 NVIDIA Morpheus 加速警报分流和 LLM 代理强化安全运营中心

多代理 AI 和 GPU 驱动的声音转文本技术创新

数据科学

NVIDIA 极致软硬件协同设计如何助力 Sarvam AI 主权模型实现惊人推理性能跃升

登顶 GPU 内核排行榜：借助 NVIDIA CUDA.compute 实现卓越性能

在 NVIDIA Run:ai 中利用 GPU 解锁大规模 Token 吞吐能力

如何使用 Nemotron 为 RAG 构建文档处理流程

借助 CUDA Tile IR 后端推进 OpenAI Triton 的 GPU 编程

如何使用 NVIDIA Earth-2 解锁粗略气候投影的局部细节

如何在 NVIDIA CUDA Tile 中编写高性能矩阵乘法

了解 NVIDIA cuOpt 如何通过原始启发式算法加速混合整数优化