精选
2026年 6月 10日
在 NVIDIA 上运行 DiffusionGemma,实现开发者就绪型高吞吐量文本生成
构建实时 AI (例如聊天助手、copilot 和代理式工作流) 的开发者通常会受到词元-by-词元生成速度的限制。这限制了响应能力,
2 MIN READ
2026年 6月 10日
为 AI 工厂设计生产就绪型电池能源存储系统
AI 工厂正在改变数据中心基础设施的功能。 与传统数据中心不同,AI 工厂旨在大规模制造智能。它们运行功率密集型训练和推理工作负载,
2 MIN READ
2026年 6月 9日
借助 NVIDIA DGX Spark Enterprise 可管理性,大规模控制 AI 基础设施的生命周期
随着 AI 基础设施的扩展,企业对运营成熟度的期望与日俱增。组织期望这些系统具备可配置、可观察、安全且可大规模管理的特点,
1 MIN READ
2026年 6月 9日
模型量化:借助 NVIDIA TensorRT 将 FP8 检查点转变为高性能推理引擎
将量化检查点转换为 NVIDIA TensorRT 引擎可以弥合模型优化与生产部署之间的差距,从而实现更快的推理速度、
4 MIN READ
2026年 6月 9日
借助 AI 智能体和 NVIDIA FLARE Auto-FL 加速联邦学习研究
联邦学习 (FL) 研究通常从一个看似简单的问题开始:我们接下来应该尝试什么?在实验开始之前,新的聚合规则、FedProx 系数、
2 MIN READ
2026年 6月 9日
借助智能体技能和 NVIDIA Nemotron 语音,更快地评估临床 ASR 模型
训练语音 AI 模型以正确识别或合成临床术语异常困难。药物名称如 Acetaminophen、Amlodipine、
3 MIN READ
2026年 5月 29日
DynoSim:模拟帕累托前沿
现代 LLM 服务难以调优,因为每一次部署都是一组相互作用的选择堆栈:模型后端、张量并行形状、prefill/decode 拆分、
3 MIN READ
2026年 5月 27日
NVIDIA Dynamo Snapshot:面向 Kubernetes 上推理工作负载的快速启动
在生产环境中的推理部署里,需求会随时间波动,因此推理副本需要弹性扩缩容。然而,在 Kubernetes 上冷启动推理工作负载可能需要几分钟。
4 MIN READ
2026年 5月 27日
NVIDIA RTX 面向游戏开发者有哪些新内容:适用于 UE5 的 DLSS 4.5 和多语言 AI 角色
NVIDIA RTX 为游戏开发者提供了通往 AI 驱动角色、帧生成和光线追踪渲染的直接路径。
2 MIN READ
2026年 5月 26日
借助 NVIDIA CompileIQ 自动调整功能提升内核性能
NVIDIA CompileIQ 解决了性能工程中最棘手的问题之一:找到为特定工作负载解锁最佳性能的编译器选项。 想象一下,
3 MIN READ
2026年 5月 26日
使用 NVIDIA CUDA Tile 在 C++ 中开发高性能 GPU 内核
开发者现在可以在现有的大型 C++ GPU 代码库中使用 NVIDIA CUDA Tile 编程,
6 MIN READ
2026年 5月 26日
借助 NVIDIA RTX PRO 4500 Blackwell 更快地运行关键基因组学和蛋白质折叠工作负载
精准医疗依赖于两项基本能力:在基因组层面了解疾病,以及在分子层面确定治疗方法。 NVIDIA 对精准医疗的贡献不仅限于加速计算,
3 MIN READ
2026年 5月 22日
大规模合成逼真的 3D 医学影像,提供经过预训练的模型
高质量的 3D 医学成像数据是现代放射学 AI 的基础,但对这些数据的访问往往受到数据稀缺、隐私限制和专家标注成本高昂的限制。因此,
3 MIN READ
2026年 5月 21日
实时了解跨 Kubernetes 集群的 GPU 使用情况
要更大限度地发挥 AI 基础设施的价值,需要深入了解 GPU 利用率。然而,许多在 Kubernetes 上运行 AI…
2 MIN READ
2026年 5月 21日
借助 Slurm 拓扑感知型作业调度功能,在 NVIDIA GB200 NVL72 上实现百万兆级性能
随着AI模型的规模和复杂性持续提升,要充分发挥现代加速基础设施的性能,关键在于如何合理分配工作负载以及硬件的部署方式。
3 MIN READ
2026年 5月 21日
在电信 AI 工厂构建词元+ Metered AI 服务
全球各地的电信公司正基于主权AI工厂基于NVIDIA云合作伙伴(NCP)参考架构,建设,使政府、企业和初创公司能够以适当的控制力、
3 MIN READ