General

2026年 1月 27日

通过开放式即插即用产品加速扩散模型

大规模扩散模型的近期进展深刻改变了生成式 AI 在多个领域的应用，涵盖图像合成、音频生成、3D 素材创建、分子设计等。

2 MIN READ

2026年 1月 15日

如何使用合成数据和强化学习训练 AI 智能体执行命令行任务

如果您的计算机智能体能够学习新的命令行界面（CLI），并且在无需编写文件或自由输入 shell 命令的情况下也能安全操作，该怎么办？

3 MIN READ

2026年 1月 14日

如何在 NVIDIA CUDA Tile 中编写高性能矩阵乘法

本博文是系列课程的一部分，旨在帮助开发者学习 NVIDIA CUDA Tile 编程，掌握构建高性能 GPU 内核的方法，

5 MIN READ

2026年 1月 9日

重塑大模型内存：以上下文为训练数据，实现测试时学习

我们在新闻中不断看到拥有更大上下文窗口的大型语言模型（LLM），它们承诺能够同时查看完整的对话历史、大量书籍或多个代码库。然而，

1 MIN READ

2026年 1月 7日

借助 NVIDIA BlueField Astra 重新定义 NVIDIA Vera Rubin NVL72 的安全 AI 基础设施

大规模 AI 创新正在推动对加速计算基础设施的空前需求。训练万亿参数基础模型，采用分解架构支持这些模型，并以高吞吐量处理推理工作负载，

2 MIN READ

2026年 1月 6日

NVIDIA BlueField-4 赋能的推理上下文记忆存储平台，引领 AI 迈向新前沿

随着代理式 AI 工作流将上下文窗口扩展到数百万个 token，并将模型规模扩展到数百万亿个参数，AI 原生企业正面临着越来越多的扩展挑战。

1 MIN READ

2026年 1月 5日

基于 NVIDIA Alpamayo 构建具备推理能力的辅助驾驶汽车

辅助驾驶研究领域正经历一场快速变革。视觉-语言-动作推理模型（Reasoning VLA）的出现正重塑该领域，

3 MIN READ

2026年 1月 5日

开源 AI 工具升级加速 NVIDIA RTX PC 上的 LLM 和扩散模型

在小语言模型（SLM）和扩散模型（例如 FLUX.2、GPT-OSS-20B 和 Nemotron 3 Nano）质量持续提升的推动下，

3 MIN READ

2026年 1月 5日

如何使用 RAG 和安全护栏构建语音智能体

构建智能体不仅仅是“调用 API”，而是需要将检索、语音、安全和推理组件整合在一起，使其像一个统一并互相协同的系统一样运行。

2 MIN READ

2025年 12月 17日

借助 NVIDIA Isaac Sim 与 World Labs Marble 加速机器人仿真环境构建

一直以来，为机器人仿真构建逼真的 3D 环境是一项非常耗费人力的工作，往往需要数周的手动建模与配置。如今，借助生成式世界模型，

2 MIN READ

2025年 12月 17日

利用 Aether 项目将 Apache Spark 工作负载在 Amazon EMR 上大规模迁移至 GPU

数据是现代业务的燃料，但依赖基于 CPU 的 Apache Spark 管道会带来高昂的成本。这些系统天生速度较慢，需要庞大的基础设施，

3 MIN READ

2025年 12月 16日

塑造 2025 年的 AI 工厂、物理 AI 以及模型、智能体和基础设施的进步

对于使用 NVIDIA 技术的开发者和研究人员而言，2025 年是又一个具有里程碑意义的年份。在数据中心功耗与计算设计、AI 基础设施、

3 MIN READ

2025年 12月 16日

使用 Skip Softmax 加速 NVIDIA TensorRT-LLM 中的长上下文推理

对于大规模部署 LLM 的机器学习工程师来说，这个等式既熟悉又无情：随着上下文长度的增加，注意力计算成本呈爆炸式增长。

4 MIN READ

2025年 12月 15日

NVIDIA CUDA-X 加速 DuckDB 全新 Sirius GPU 引擎，刷新 ClickBench 性能纪录

NVIDIA 正在与威斯康星大学麦迪逊分校合作，通过开源 Sirius 引擎将 GPU 加速分析引入 DuckDB。 DuckDB 因其简洁、

3 MIN READ

2025年 12月 15日

减小 CUDA 二进制大小以在 PyPI 上分发 cuML

从 25.10 版本开始，现在可以直接从 PyPI 下载用于 pip 安装的 cuML wheels。

3 MIN READ

2025年 12月 15日

利用 NVIDIA MGX 为未来数据中心提供灵活高效性能

重塑计算格局的 AI 热潮将在 2026 年进一步加速扩展。随着模型能力与计算能力的突破持续推动发展，

2 MIN READ