云服务

2026年 7月 24日

ModelExpress：以光速分发模型伪影

每移动一个字节都会产生一定的成本。随着模型检查点数量增长到数百 GB 甚至一 TB，这一成本会迅速增加。更糟糕的是，

3 MIN READ

2026年 7月 9日

借助 NVIDIA NeMo 生成用于金融 AI 研究的合成数据

金融自然语言处理 (NLP) 的微调 LLM 受到有限且不平衡的数据的限制。现实世界的金融新闻过度代表收益和股票动态，而信用评级变化、

5 MIN READ

2026年 7月 2日

基于硬件的 AI 安全性不会拖慢您的速度

AI 改变了组织的运营方式，推动了前所未有的生产力和创新水平。但是，数据隐私、主权以及如何保护使用中的数据，

2 MIN READ

2026年 6月 11日

借助 NVIDIA Quantum InfiniBand 实现一键式多租户安全

NVIDIA Quantum InfiniBand 现可在 Unified Fabric Manager (UFM)…

2 MIN READ

2026年 6月 9日

模型量化：借助 NVIDIA TensorRT 将 FP8 检查点转变为高性能推理引擎

将量化检查点转换为 NVIDIA TensorRT 引擎可以弥合模型优化与生产部署之间的差距，从而实现更快的推理速度、

4 MIN READ

2026年 5月 21日

借助 Slurm 拓扑感知型作业调度功能，在 NVIDIA GB200 NVL72 上实现百万兆级性能

随着AI模型的规模和复杂性持续提升，要充分发挥现代加速基础设施的性能，关键在于如何合理分配工作负载以及硬件的部署方式。

3 MIN READ

2026年 5月 21日

在电信 AI 工厂构建词元+ Metered AI 服务

全球各地的电信公司正基于主权AI工厂基于NVIDIA云合作伙伴（NCP）参考架构，建设，使政府、企业和初创公司能够以适当的控制力、

3 MIN READ

2026年 4月 9日

使用 Slurm 在 Kubernetes 上运行大规模 GPU 工作负载

Slurm 是适用于 Linux 的开源集群管理和作业调度系统。它可以管理超过 65% 的 TOP500 系统的作业调度。

3 MIN READ

2026年 4月 1日

使用统一服务和实时 AI 加速 AI 工厂的词元生产

在当今的 AI 工厂环境中，性能并不是理论性的。它是经济、竞争和生存的。可用 GPU 时间每减少 1%，就意味着每小时损失数百万词元。

2 MIN READ

2026年 1月 8日

借助 NVIDIA Blackwell 实现多专家模型推理的巨大性能飞跃

随着 AI 模型持续变得更加智能，人们能够依赖它们完成日益增多的任务。这导致用户（从消费者到企业）与 AI 的交互愈发频繁，

2 MIN READ

2020年 8月 18日

使用 NVIDIA EGX 在 NVIDIA Jetson Xavier NX 微型服务器上部署 AI 应用程序

现代对敏捷能力和零停机时间持续创新的期望要求改变嵌入式和边缘设备软件的开发和部署方式。在边缘采用诸如微服务、

6 MIN READ

2020年 5月 14日

使用 NVIDIA Jetson-Xavier NX 开发工具包，为边缘人工智能设备带来原始云般的灵活性

今天， NVIDIA 发布了基于 Jetson Xavier NX 模块的 NVIDIA Jetson Xavier NX 开发工具包。

5 MIN READ

2018年 10月 31日

使用深度学习抑制

想象一下在机场等你的航班。突然，一个重要的商务电话与一个高姿态的客户点亮了你的手机。大量的背景噪音使你周围的声音变得杂乱无章——背景嘈杂，

4 MIN READ

2018年 6月 1日

在容器运行时生态系统中启用 GPU

NVIDIA 使用容器来开发、测试、基准测试和部署深度学习（ DL ）框架和 HPC 应用程序。大约两年前，

8 MIN READ