Blackwell
2026年 6月 8日
在 NVIDIA Blackwell 上使用 NVFP4,使用 JAX 和 MaxText 更快地训练模型
对前沿 LLM 进行预训练,可归结为吞吐量。当数千个加速器的训练规模达到数万亿词元时,
3 MIN READ
2026年 5月 26日
借助 NVIDIA RTX PRO 4500 Blackwell 更快地运行关键基因组学和蛋白质折叠工作负载
精准医疗依赖于两项基本能力:在基因组层面了解疾病,以及在分子层面确定治疗方法。 NVIDIA 对精准医疗的贡献不仅限于加速计算,
3 MIN READ
2026年 5月 21日
借助 Slurm 拓扑感知型作业调度功能,在 NVIDIA GB200 NVL72 上实现百万兆级性能
随着AI模型的规模和复杂性持续提升,要充分发挥现代加速基础设施的性能,关键在于如何合理分配工作负载以及硬件的部署方式。
3 MIN READ
2026年 5月 21日
在电信 AI 工厂构建词元+ Metered AI 服务
全球各地的电信公司正基于主权AI工厂基于NVIDIA云合作伙伴(NCP)参考架构,建设,使政府、企业和初创公司能够以适当的控制力、
3 MIN READ
2026年 4月 30日
如何在 ComfyUI 中构建、运行和扩展高质量的创作者工作流
如今,创意和可视化团队可以利用更精简的团队制作更多格式的素材。生成式 AI 可以加速这项工作,
3 MIN READ
2026年 4月 22日
借助 NVIDIA RTX PRO 4500 Blackwell Server Edition 和 NVIDIA vGPU 20 扩展 AI 就绪型数据中心
从 Microsoft Office 等生产力软件到更复杂的设计和工程工具,AI 集成正在重新定义主流企业应用。
4 MIN READ
2026年 4月 1日
使用统一服务和实时 AI 加速 AI 工厂的词元生产
在当今的 AI 工厂环境中,性能并不是理论性的。它是经济、竞争和生存的。可用 GPU 时间每减少 1%,就意味着每小时损失数百万词元。
2 MIN READ
2026年 2月 25日
借助 NVIDIA Blackwell Ultra 提升 Softmax 的效率
LLM 上下文长度呈爆炸式增长,架构正朝着更复杂的注意力机制发展,例如多头潜在注意力(MLA)和分组查询注意力(GQA)。因此,
2 MIN READ
2026年 2月 18日
NVIDIA 极致软硬件协同设计如何助力 Sarvam AI 主权模型实现惊人推理性能跃升
随着全球人工智能采用的加速,开发者面临日益严峻的挑战:如何提供符合现实世界延迟和成本要求的大语言模型(LLM)性能。
4 MIN READ
2026年 2月 6日
NVFP4 加速 AI 训练与推理的三大方式
新兴的 AI 模型在规模和复杂性上持续增长,对训练和推理的计算性能需求日益提升,已远超摩尔定律所能满足的范畴。
2 MIN READ
2026年 1月 8日
借助 NVIDIA Blackwell 实现多专家模型推理的巨大性能飞跃
随着 AI 模型持续变得更加智能,人们能够依赖它们完成日益增多的任务。这导致用户(从消费者到企业)与 AI 的交互愈发频繁,
2 MIN READ
2026年 1月 5日
深度解析 NVIDIA Rubin 平台:六款新芯片打造AI超级计算机
AI 已进入工业阶段。 最初是用于执行离散 AI 模型训练和面向人类推理的系统,现已演变为全天候运行的 AI 工厂,持续将功率、
12 MIN READ
2025年 12月 17日
使用 NVIDIA cuDSS 解决大规模线性稀疏问题
随着芯片设计、制造和多物理场仿真复杂性的持续提升,在电子设计自动化(EDA)、
5 MIN READ
2025年 9月 29日
在 NVIDIA Isaac Lab 2.3 中使用全身控制和增强遥操作,简化机器人学习
基于真实世界演示训练机器人策略,不仅成本高、速度慢,还容易出现过拟合问题,进而限制其在不同任务与环境中的泛化能力。
3 MIN READ