AI 模型训练
2026年 6月 23日
通过全栈推理和训练优化,更大限度地提高 AI 工厂的能效
为运行 AI 工厂,电力成本可占运营支出(OpEx)的 40%。每瓦可用于开销、数据摄取、训练,或为客户生成 token。
2 MIN READ
2026年 6月 16日
如何优化基于 Transformer 的模型以进行低精度训练
Transformer 架构是许多现代大型语言和生成式 AI 模型的支柱。随着这些模型规模的扩大,
3 MIN READ
2026年 6月 15日
使用 NVIDIA BioNeMo Recipes 使用 LoRA 微调生物基础模型
基础模型 正在重塑计算生物学。预训练在大量蛋白质或基因组序列的语料库上的模型,如 ESM2 (一种蛋白质语言模型)和 Evo 2 (一种…
4 MIN READ
2026年 5月 31日
如何使用 NVIDIA Alpamayo 在闭环中对自动驾驶车辆模型进行后训练
开发自动驾驶车辆(AV)政策需要弥合训练与部署之间的一个重要差距。
2 MIN READ
2026年 5月 22日
大规模合成逼真的 3D 医学影像,提供经过预训练的模型
高质量的 3D 医学成像数据是现代放射学 AI 的基础,但对这些数据的访问往往受到数据稀缺、隐私限制和专家标注成本高昂的限制。因此,
3 MIN READ
2026年 4月 20日
使用端到端 FP8 精度运行高吞吐量强化学习训练
随着 LLM 从简单的文本生成过渡到复杂的推理,强化学习 (RL) 发挥着核心作用。群相对策略优化 (GRPO) 等算法为这种转变提供动力,
3 MIN READ
2026年 2月 28日
使用 NVIDIA NeMo 构建电信自主网络推理模型
自主网络正迅速成为电信行业的重点任务之一。根据最新的 NVIDIA 电信行业 AI 现状报告,65% 的运营商表示 AI 正在推动网络自动化,
2 MIN READ
2026年 2月 23日
采用 NVFP4 低精度训练提升吞吐量,兼顾精度无损
随着 AI 模型和数据集规模的不断扩大,仅依赖更高精度的 BF16 训练已难以满足需求。训练吞吐量预期、内存限制以及成本上升等关键挑战,
3 MIN READ
2026年 2月 5日
如何构建合规的 AI 模型蒸馏合成数据工作流
专用 AI 模型用于执行特定任务或解决特定问题。然而,如果您曾尝试对特定领域的模型进行微调或蒸馏,可能会遇到一些障碍,例如:
4 MIN READ
2026年 2月 3日
在 JAX 和 XLA 中加速长上下文模型训练
大语言模型(LLM)的上下文窗口正在迅速扩展,近期的模型已支持128K、256K甚至更长的词元序列。然而,
3 MIN READ