Deep dive
2026年 1月 13日
了解 NVIDIA cuOpt 如何通过原始启发式算法加速混合整数优化
NVIDIA cuOpt 是一款 GPU 加速的优化引擎,旨在为大规模复杂决策问题提供高效、高质量的解决方案。 混合整数规划(MIP)…
2 MIN READ
2026年 1月 9日
多智能体仓库 AI 命令层实现卓越运营和供应链智能
仓库的自动化程度从未如此之高,数据也从未如此丰富,运营要求同样日益提升,但许多仓库仍依赖于无法跟上需求的系统。吞吐量持续攀升,
2 MIN READ
2026年 1月 9日
重塑大模型内存:以上下文为训练数据,实现测试时学习
我们在新闻中不断看到拥有更大上下文窗口的大型语言模型(LLM),它们承诺能够同时查看完整的对话历史、大量书籍或多个代码库。然而,
1 MIN READ
2026年 1月 8日
NVIDIA TensorRT Edge-LLM 加速汽车与机器人领域的 LLM 和 VLM 推理
大语言模型(LLM)与多模态推理系统正迅速突破数据中心的局限。越来越多的汽车与机器人领域的开发者希望将对话式 AI 智能体、
2 MIN READ
2026年 1月 7日
借助 NVIDIA BlueField Astra 重新定义 NVIDIA Vera Rubin NVL72 的安全 AI 基础设施
大规模 AI 创新正在推动对加速计算基础设施的空前需求。训练万亿参数基础模型,采用分解架构支持这些模型,并以高吞吐量处理推理工作负载,
2 MIN READ
2026年 1月 6日
NVIDIA BlueField-4 赋能的推理上下文记忆存储平台,引领 AI 迈向新前沿
随着代理式 AI 工作流将上下文窗口扩展到数百万个 token,并将模型规模扩展到数百万亿个参数,AI 原生企业正面临着越来越多的扩展挑战。
1 MIN READ
2026年 1月 6日
NVIDIA Spectrum-X 以太网硅光技术助力扩展节能高效的 AI 工厂
NVIDIA 将率先为 AI 工厂引入采用光电一体封装 (CPO) 的优化以太网网络,通过 NVIDIA Spectrum-X…
2 MIN READ
2026年 1月 5日
开源 AI 工具升级加速 NVIDIA RTX PC 上的 LLM 和扩散模型
在小语言模型(SLM)和扩散模型(例如 FLUX.2、GPT-OSS-20B 和 Nemotron 3 Nano)质量持续提升的推动下,
3 MIN READ
2026年 1月 5日
深度解析 NVIDIA Rubin 平台:六款新芯片打造AI超级计算机
AI 已进入工业阶段。 最初是用于执行离散 AI 模型训练和面向人类推理的系统,现已演变为全天候运行的 AI 工厂,持续将功率、
12 MIN READ
2025年 12月 17日
利用 AI 物理进行技术性计算机辅助设计仿真
技术计算机辅助设计 (TCAD) 仿真涵盖工艺与器件仿真,对现代半导体制造至关重要。它支持“虚拟制造”,使工程师能够在投入昂贵的物理制造前,
2 MIN READ
2025年 12月 12日
如何在现代 NVIDIA GPU 架构上扩展快速里叶变换以实现百亿亿次级计算
快速里叶变换 (FFT) 广泛应用于科学计算,涵盖分子动力学、信号处理、计算流体动力学 (CFD)、无线多媒体以及机器学习等领域。
4 MIN READ
2025年 12月 9日
借助 NVIDIA Aerial Omniverse 数字孪生改进 AI 原生 6G 设计
AI原生的6G网络将为数十亿的智能设备、智能体和机器提供服务。随着行业拓展至FR3(7–24 GHz)等新频段,无线电物理特性变得更加敏感,
2 MIN READ
2025年 12月 8日
使用 NVFP4 KV 缓存优化大批次与长上下文推理
量化是大规模推理中的关键手段之一。通过降低权重、激活值和KV缓存的精度,可以有效减少内存占用和计算开销,从而显著提升推理吞吐量、降低延迟,
3 MIN READ
2025年 12月 4日
借助功率配置文件优化 AI 和 HPC 工作负载的数据中心效率
不断呈指数级增长的计算需求正推动功耗持续上升,使数据中心面临巨大压力。在设施功耗受限的背景下,提升每瓦功耗的计算性能,
2 MIN READ
2025年 12月 4日
NVIDIA CUDA 13.1 引入 NVIDIA CUDA Tile 等新功能,为下一代 GPU 编程提供更强动力
NVIDIA CUDA 13.1 是自 CUDA 二十年前发明以来,规模最大、内容最全面的一次更新。 最新的版本包含一系列新功能与改进,
1 MIN READ
2025年 12月 2日
NVIDIA 加速的 Mistral 3 开源模型,实现多规模下的高效与精准
新的 Mistral 3 开放模型系列为开发者和企业提供了卓越的准确性、高效的性能以及灵活的定制功能。
3 MIN READ