网络/通讯
2026年 6月 11日
借助 NVIDIA Quantum InfiniBand 实现一键式多租户安全
NVIDIA Quantum InfiniBand 现可在 Unified Fabric Manager (UFM)…
2 MIN READ
2026年 5月 31日
借助 NVIDIA DOCA 芯片级安全,推进代理式 AI 的 AI 基础设施建设
AI 时代正在催生一种新型基础设施:AI 工厂。AI 工厂能将数据转化为智能,赋能规模空前的自主AI 智能体。借助加速计算,
3 MIN READ
2026年 5月 12日
如何在 AI 模型服务中消除管道摩擦
从训练好的AI模型到投入生产的路径本应顺畅,但实际情况往往并非如此。许多团队花费数周时间对模型进行微调,
2 MIN READ
2026年 5月 11日
隆重推出 NVIDIA Fleet Intelligence,实现实时 GPU 车队可视化和优化
大型 GPU 集群的计算能力带来了前所未有的创新机会,并在创纪录的时间内为客户提供价值。然而,这些进步带来了各种挑战。在规模化方面,
2 MIN READ
2026年 5月 7日
借助 Slurm 块调度在 NVIDIA GB200 NVL72 上实现峰值系统和工作负载效率
NVIDIA GB200 NVL72 通过在整个机架范围内扩展 NVIDIA NVLink 一致性,开创了一种全新的 GPU 集群构建方式。
3 MIN READ
2026年 5月 7日
借助 NCCL Inspector 和 Prometheus 实现实时性能监控和快速调试
分布式深度学习依赖于 NVIDIA 集合通信库(NCCL) 实现快速可靠的 GPU 间通信。当训练速度变慢时,
3 MIN READ
2026年 4月 29日
使用 NVIDIA 企业参考架构为 AI 工厂提供支持
下一波企业生产力浪潮将以AI工厂为基础。随着企业部署能够实现大规模推理、自动化和实时决策的代理式AI系统,
2 MIN READ
2026年 4月 14日
NVIDIA NVbandwidth:测量 GPU 互连和显存性能的必备工具
在编写 CUDA 应用程序时,要编写出色的代码,您需要关注的最重要的一点是数据传输性能。这适用于单 GPU 和多 GPU 系统。
3 MIN READ
2026年 4月 2日
使用批量模式 VC-6 和 NVIDIA Nsight 加速视觉 AI 工作流
在视觉 AI 系统中,模型吞吐量不断提高。周围的工作流阶段必须与时俱进,包括解码、预处理和 GPU 调度。在上一篇文章中,
3 MIN READ
2026年 3月 16日
借助 NVIDIA DSX Air 设计、仿真并扩展 AI 工厂基础设施
构建 AI 工厂的复杂性源于需要高效集成计算、网络、安全与存储系统。为了快速部署 AI 并提高投资回报率,全新 NVIDIA DSX Air…
2 MIN READ
2026年 2月 28日
开发者可用 5 款全新数字孪生产品构建 6G 网络
要实现 6G,电信行业必须应对一项根本性挑战:如何设计、训练并验证那些过于复杂而无法在现实世界中进行测试的 AI 原生网络。
2 MIN READ
2026年 2月 28日
使用 NVIDIA NeMo 构建电信自主网络推理模型
自主网络正迅速成为电信行业的重点任务之一。根据最新的 NVIDIA 电信行业 AI 现状报告,65% 的运营商表示 AI 正在推动网络自动化,
2 MIN READ
2026年 2月 3日
在 JAX 和 XLA 中加速长上下文模型训练
大语言模型(LLM)的上下文窗口正在迅速扩展,近期的模型已支持128K、256K甚至更长的词元序列。然而,
3 MIN READ
2026年 2月 2日
使用混合专家并行优化混合专家训练的通信
在 LLM 训练中,超大规模多专家模型 (MoE) 的专家并行 (EP) 通信面临巨大挑战。EP 通信本质上属于多对多模式,
4 MIN READ
2026年 1月 7日
借助 NVIDIA BlueField Astra 重新定义 NVIDIA Vera Rubin NVL72 的安全 AI 基础设施
大规模 AI 创新正在推动对加速计算基础设施的空前需求。训练万亿参数基础模型,采用分解架构支持这些模型,并以高吞吐量处理推理工作负载,
2 MIN READ
2026年 1月 6日
NVIDIA BlueField-4 赋能的推理上下文记忆存储平台,引领 AI 迈向新前沿
随着代理式 AI 工作流将上下文窗口扩展到数百万个 token,并将模型规模扩展到数百万亿个参数,AI 原生企业正面临着越来越多的扩展挑战。
1 MIN READ