云服务
2026年 6月 11日
借助 NVIDIA Quantum InfiniBand 实现一键式多租户安全
NVIDIA Quantum InfiniBand 现可在 Unified Fabric Manager (UFM)…
2 MIN READ
2026年 6月 9日
模型量化:借助 NVIDIA TensorRT 将 FP8 检查点转变为高性能推理引擎
将量化检查点转换为 NVIDIA TensorRT 引擎可以弥合模型优化与生产部署之间的差距,从而实现更快的推理速度、
4 MIN READ
2026年 5月 21日
借助 Slurm 拓扑感知型作业调度功能,在 NVIDIA GB200 NVL72 上实现百万兆级性能
随着AI模型的规模和复杂性持续提升,要充分发挥现代加速基础设施的性能,关键在于如何合理分配工作负载以及硬件的部署方式。
3 MIN READ
2026年 5月 21日
在电信 AI 工厂构建词元+ Metered AI 服务
全球各地的电信公司正基于主权AI工厂基于NVIDIA云合作伙伴(NCP)参考架构,建设,使政府、企业和初创公司能够以适当的控制力、
3 MIN READ
2026年 4月 9日
使用 Slurm 在 Kubernetes 上运行大规模 GPU 工作负载
Slurm 是适用于 Linux 的开源集群管理和作业调度系统。它可以管理超过 65% 的 TOP500 系统 的作业调度。
3 MIN READ
2026年 4月 1日
使用统一服务和实时 AI 加速 AI 工厂的词元生产
在当今的 AI 工厂环境中,性能并不是理论性的。它是经济、竞争和生存的。可用 GPU 时间每减少 1%,就意味着每小时损失数百万词元。
2 MIN READ
2026年 1月 8日
借助 NVIDIA Blackwell 实现多专家模型推理的巨大性能飞跃
随着 AI 模型持续变得更加智能,人们能够依赖它们完成日益增多的任务。这导致用户(从消费者到企业)与 AI 的交互愈发频繁,
2 MIN READ
2020年 8月 18日
使用 NVIDIA EGX 在 NVIDIA Jetson Xavier NX 微型服务器上部署 AI 应用程序
现代对敏捷能力和零停机时间持续创新的期望要求改变嵌入式和边缘设备软件的开发和部署方式。在边缘采用诸如微服务、
6 MIN READ
2020年 5月 14日
使用 NVIDIA Jetson-Xavier NX 开发工具包,为边缘人工智能设备带来原始云般的灵活性
今天, NVIDIA 发布了基于 Jetson Xavier NX 模块的 NVIDIA Jetson Xavier NX 开发工具包 。
5 MIN READ
2018年 10月 31日
使用深度学习抑制
想象一下在机场等你的航班。突然,一个重要的商务电话与一个高姿态的客户点亮了你的手机。大量的背景噪音使你周围的声音变得杂乱无章——背景嘈杂,
4 MIN READ
2018年 6月 1日
在容器运行时生态系统中启用 GPU
NVIDIA 使用容器来开发、测试、基准测试和部署深度学习( DL )框架和 HPC 应用程序。大约两年前,
8 MIN READ