数据中心/云端
2026年 6月 10日
为 AI 工厂设计生产就绪型电池能源存储系统
AI 工厂正在改变数据中心基础设施的功能。 与传统数据中心不同,AI 工厂旨在大规模制造智能。它们运行功率密集型训练和推理工作负载,
2 MIN READ
2026年 6月 8日
在 NVIDIA Blackwell 上使用 NVFP4,使用 JAX 和 MaxText 更快地训练模型
对前沿 LLM 进行预训练,可归结为吞吐量。当数千个加速器的训练规模达到数万亿词元时,
3 MIN READ
2026年 5月 29日
DynoSim:模拟帕累托前沿
现代 LLM 服务难以调优,因为每一次部署都是一组相互作用的选择堆栈:模型后端、张量并行形状、prefill/decode 拆分、
3 MIN READ
2026年 5月 26日
借助 NVIDIA RTX PRO 4500 Blackwell 更快地运行关键基因组学和蛋白质折叠工作负载
精准医疗依赖于两项基本能力:在基因组层面了解疾病,以及在分子层面确定治疗方法。 NVIDIA 对精准医疗的贡献不仅限于加速计算,
3 MIN READ
2026年 5月 21日
实时了解跨 Kubernetes 集群的 GPU 使用情况
要更大限度地发挥 AI 基础设施的价值,需要深入了解 GPU 利用率。然而,许多在 Kubernetes 上运行 AI…
2 MIN READ
2026年 5月 21日
借助 Slurm 拓扑感知型作业调度功能,在 NVIDIA GB200 NVL72 上实现百万兆级性能
随着AI模型的规模和复杂性持续提升,要充分发挥现代加速基础设施的性能,关键在于如何合理分配工作负载以及硬件的部署方式。
3 MIN READ
2026年 5月 21日
在电信 AI 工厂构建词元+ Metered AI 服务
全球各地的电信公司正基于主权AI工厂基于NVIDIA云合作伙伴(NCP)参考架构,建设,使政府、企业和初创公司能够以适当的控制力、
3 MIN READ
2026年 5月 14日
NVIDIA Vera Rubin 平台如何解决代理式 AI 的纵向扩展问题
代理式推理通过引入非确定性轨迹(即AI智能体在执行任务时生成的动作、观察结果和决策),从根本上改变了推理工作负载的运行时特性。
2 MIN READ
2026年 5月 11日
隆重推出 NVIDIA Fleet Intelligence,实现实时 GPU 车队可视化和优化
大型 GPU 集群的计算能力带来了前所未有的创新机会,并在创纪录的时间内为客户提供价值。然而,这些进步带来了各种挑战。在规模化方面,
2 MIN READ
2026年 5月 8日
流式传输词元和工具:NVIDIA Dynamo 中的多回合代理线束支持
智能体交换必须保留结构化交互:助手通过一次或多次工具调用进行交错推理,随后用户轮流将相应的工具结果返回至模型上下文。
4 MIN READ
2026年 5月 7日
借助 Slurm 块调度在 NVIDIA GB200 NVL72 上实现峰值系统和工作负载效率
NVIDIA GB200 NVL72 通过在整个机架范围内扩展 NVIDIA NVLink 一致性,开创了一种全新的 GPU 集群构建方式。
3 MIN READ
2026年 5月 5日
借助极致协同设计构建日益复杂的代理式系统
生成式 AI 具有爆炸性的第一章由发送请求的人类和响应的模型定义。代理式章节有所不同。 智能体不会遵循预先确定的动作序列。它们可以调用工具,
3 MIN READ
2026年 4月 29日
使用 NVIDIA 企业参考架构为 AI 工厂提供支持
下一波企业生产力浪潮将以AI工厂为基础。随着企业部署能够实现大规模推理、自动化和实时决策的代理式AI系统,
2 MIN READ
2026年 4月 28日
在 NVIDIA BioNeMo 中使用上下文并行性扩展生物分子建模
几十年来,计算生物学一直在简化主义妥协下运作。为了将复杂的生物系统整合到单个 GPU 的有限内存中,
2 MIN READ
2026年 4月 22日
借助 NVIDIA RTX PRO 4500 Blackwell Server Edition 和 NVIDIA vGPU 20 扩展 AI 就绪型数据中心
从 Microsoft Office 等生产力软件到更复杂的设计和工程工具,AI 集成正在重新定义主流企业应用。
4 MIN READ
2026年 4月 17日
借助 NVIDIA Dynamo 实现代理式推理的全栈优化
编程智能体开始大规模编写产品级代码。 Stripe 的智能体每周生成 1300 多个 PR。 Ramp 将 30%
4 MIN READ