网络/通讯
2026年 5月 12日
如何在 AI 模型服务中消除管道摩擦
从训练好的AI模型到投入生产的路径本应顺畅,但实际情况往往并非如此。许多团队花费数周时间对模型进行微调,
2 MIN READ
2026年 5月 11日
隆重推出 NVIDIA Fleet Intelligence,实现实时 GPU 车队可视化和优化
大型 GPU 集群的计算能力带来了前所未有的创新机会,并在创纪录的时间内为客户提供价值。然而,这些进步带来了各种挑战。在规模化方面,
2 MIN READ
2026年 5月 7日
借助 Slurm 块调度在 NVIDIA GB200 NVL72 上实现峰值系统和工作负载效率
NVIDIA GB200 NVL72 通过在整个机架范围内扩展 NVIDIA NVLink 一致性,开创了一种全新的 GPU 集群构建方式。
3 MIN READ
2026年 5月 7日
借助 NCCL Inspector 和 Prometheus 实现实时性能监控和快速调试
分布式深度学习依赖于 NVIDIA 集合通信库(NCCL) 实现快速可靠的 GPU 间通信。当训练速度变慢时,
3 MIN READ
2026年 4月 29日
使用 NVIDIA 企业参考架构为 AI 工厂提供支持
下一波企业生产力浪潮将以AI工厂为基础。随着企业部署能够实现大规模推理、自动化和实时决策的代理式AI系统,
2 MIN READ
2026年 4月 14日
NVIDIA NVbandwidth:测量 GPU 互连和显存性能的必备工具
在编写 CUDA 应用程序时,要编写出色的代码,您需要关注的最重要的一点是数据传输性能。这适用于单 GPU 和多 GPU 系统。
3 MIN READ
2026年 4月 2日
使用批量模式 VC-6 和 NVIDIA Nsight 加速视觉 AI 工作流
在视觉 AI 系统中,模型吞吐量不断提高。周围的工作流阶段必须与时俱进,包括解码、预处理和 GPU 调度。在上一篇文章中,
3 MIN READ
2026年 2月 3日
在 JAX 和 XLA 中加速长上下文模型训练
大语言模型(LLM)的上下文窗口正在迅速扩展,近期的模型已支持128K、256K甚至更长的词元序列。然而,
3 MIN READ