AI 模型训练

2026年 7月 14日

使用代理技能在一天内对 NVIDIA Cosmos 3 进行后训练

如果自主编码 AI 智能体能够在几乎无需人工操作的情况下将您的视觉推理模型的准确率提高 90% 以上，那该多好？

4 MIN READ

2026年 7月 10日

借助主机卸载减少基于 JAX 的 LLM 训练中的高带宽内存瓶颈

在充分利用计算能力之前，大语言模型 (LLM) 训练工作负载越来越多地遇到 GPU 显存限制。模型权重、梯度、优化器状态、

3 MIN READ

2026年 7月 10日

AI 模型协同设计：硬件友好型 LLM 设计

AI 性能可归结为三个维度：部署必须平衡这三者：如果响应速度缓慢，就会浪费高准确度；如果每个用户的体验滞后，则原始吞吐量就意味着微不足道。

5 MIN READ

2026年 6月 23日

通过全栈推理和训练优化，更大限度地提高 AI 工厂的能效

为运行 AI 工厂，电力成本可占运营支出（OpEx）的 40%。每瓦可用于开销、数据摄取、训练，或为客户生成 token。

2 MIN READ

2026年 6月 16日

如何优化基于 Transformer 的模型以进行低精度训练

Transformer 架构是许多现代大型语言和生成式 AI 模型的支柱。随着这些模型规模的扩大，

3 MIN READ

2026年 6月 15日

使用 NVIDIA BioNeMo Recipes 使用 LoRA 微调生物基础模型

基础模型正在重塑计算生物学。预训练在大量蛋白质或基因组序列的语料库上的模型，如 ESM2 （一种蛋白质语言模型）和 Evo 2 （一种…

4 MIN READ

2026年 5月 31日

如何使用 NVIDIA Alpamayo 在闭环中对自动驾驶车辆模型进行后训练

开发自动驾驶车辆（AV）政策需要弥合训练与部署之间的一个重要差距。

2 MIN READ

2026年 5月 22日

大规模合成逼真的 3D 医学影像，提供经过预训练的模型

高质量的 3D 医学成像数据是现代放射学 AI 的基础，但对这些数据的访问往往受到数据稀缺、隐私限制和专家标注成本高昂的限制。因此，

3 MIN READ

2026年 4月 20日

使用端到端 FP8 精度运行高吞吐量强化学习训练

随着 LLM 从简单的文本生成过渡到复杂的推理，强化学习 (RL) 发挥着核心作用。群相对策略优化 (GRPO) 等算法为这种转变提供动力，

3 MIN READ

2026年 2月 28日

使用 NVIDIA NeMo 构建电信自主网络推理模型

自主网络正迅速成为电信行业的重点任务之一。根据最新的 NVIDIA 电信行业 AI 现状报告，65% 的运营商表示 AI 正在推动网络自动化，

2 MIN READ

2026年 2月 23日

采用 NVFP4 低精度训练提升吞吐量，兼顾精度无损

随着 AI 模型和数据集规模的不断扩大，仅依赖更高精度的 BF16 训练已难以满足需求。训练吞吐量预期、内存限制以及成本上升等关键挑战，

3 MIN READ

2026年 2月 5日

如何构建合规的 AI 模型蒸馏合成数据工作流

专用 AI 模型用于执行特定任务或解决特定问题。然而，如果您曾尝试对特定领域的模型进行微调或蒸馏，可能会遇到一些障碍，例如：

4 MIN READ

2026年 2月 3日

在 JAX 和 XLA 中加速长上下文模型训练

大语言模型（LLM）的上下文窗口正在迅速扩展，近期的模型已支持128K、256K甚至更长的词元序列。然而，

3 MIN READ