Intermediate Technical

2026年 1月 27日

通过开放式即插即用产品加速扩散模型

大规模扩散模型的近期进展深刻改变了生成式 AI 在多个领域的应用，涵盖图像合成、音频生成、3D 素材创建、分子设计等。

2 MIN READ

2026年 1月 26日

NVIDIA TensorRT for RTX 中的自适应推理可实现自动优化

传统上，在各种消费级硬件中部署 AI 应用需要进行权衡。可以针对特定 GPU 配置进行优化，以牺牲便携性为代价来提升性能；

3 MIN READ

2026年 1月 14日

如何在 NVIDIA CUDA Tile 中编写高性能矩阵乘法

本博文是系列课程的一部分，旨在帮助开发者学习 NVIDIA CUDA Tile 编程，掌握构建高性能 GPU 内核的方法，

5 MIN READ

2026年 1月 9日

构建支持本地化交互体验的 AI 产品目录系统

电子商务目录通常包含稀疏的产品数据、通用图像、基础标题和简短说明，这限制了产品的可发现性、用户参与度以及转化率。手动扩充难以规模化，

3 MIN READ

2026年 1月 9日

多智能体仓库 AI 命令层实现卓越运营和供应链智能

仓库的自动化程度从未如此之高，数据也从未如此丰富，运营要求同样日益提升，但许多仓库仍依赖于无法跟上需求的系统。吞吐量持续攀升，

2 MIN READ

2026年 1月 9日

重塑大模型内存：以上下文为训练数据，实现测试时学习

我们在新闻中不断看到拥有更大上下文窗口的大型语言模型（LLM），它们承诺能够同时查看完整的对话历史、大量书籍或多个代码库。然而，

1 MIN READ

2026年 1月 8日

借助 NVIDIA Blackwell 实现多专家模型推理的巨大性能飞跃

随着 AI 模型持续变得更加智能，人们能够依赖它们完成日益增多的任务。这导致用户（从消费者到企业）与 AI 的交互愈发频繁，

2 MIN READ

2026年 1月 8日

NVIDIA TensorRT Edge-LLM 加速汽车与机器人领域的 LLM 和 VLM 推理

大语言模型（LLM）与多模态推理系统正迅速突破数据中心的局限。越来越多的汽车与机器人领域的开发者希望将对话式 AI 智能体、

2 MIN READ

2026年 1月 7日

借助 NVIDIA BlueField Astra 重新定义 NVIDIA Vera Rubin NVL72 的安全 AI 基础设施

大规模 AI 创新正在推动对加速计算基础设施的空前需求。训练万亿参数基础模型，采用分解架构支持这些模型，并以高吞吐量处理推理工作负载，

2 MIN READ

2026年 1月 6日

NVIDIA BlueField-4 赋能的推理上下文记忆存储平台，引领 AI 迈向新前沿

随着代理式 AI 工作流将上下文窗口扩展到数百万个 token，并将模型规模扩展到数百万亿个参数，AI 原生企业正面临着越来越多的扩展挑战。

1 MIN READ

2026年 1月 6日

NVIDIA Spectrum-X 以太网硅光技术助力扩展节能高效的 AI 工厂

NVIDIA 将率先为 AI 工厂引入采用光电一体封装 (CPO) 的优化以太网网络，通过 NVIDIA Spectrum-X…

2 MIN READ

2026年 1月 5日

开源 AI 工具升级加速 NVIDIA RTX PC 上的 LLM 和扩散模型

在小语言模型（SLM）和扩散模型（例如 FLUX.2、GPT-OSS-20B 和 Nemotron 3 Nano）质量持续提升的推动下，

3 MIN READ

2026年 1月 5日

深度解析 NVIDIA Rubin 平台：六款新芯片打造AI超级计算机

AI 已进入工业阶段。最初是用于执行离散 AI 模型训练和面向人类推理的系统，现已演变为全天候运行的 AI 工厂，持续将功率、

12 MIN READ

2025年 12月 19日

借助 NVIDIA ALCHEMI Toolkit-Ops 加速 AI 驱动的化学与材料科学模拟

机器学习原子间相互作用势（MLIP）正在改变计算化学与材料科学的格局。MLIP 能够实现原子尺度模拟，

4 MIN READ

2025年 12月 17日

借助 NVIDIA Isaac Sim 与 World Labs Marble 加速机器人仿真环境构建

一直以来，为机器人仿真构建逼真的 3D 环境是一项非常耗费人力的工作，往往需要数周的手动建模与配置。如今，借助生成式世界模型，

2 MIN READ

2025年 12月 17日

利用 NVIDIA Aerial Omniverse 数字孪生精准模拟无线电环境

5G 和 6G 的发展需要高保真无线电信道建模，但当前生态系统高度分散。链路级模拟器、网络级模拟器与 AI 训练框架通常采用不同的编程语言，

5 MIN READ