精选
2025年 12月 17日
利用 Aether 项目将 Apache Spark 工作负载在 Amazon EMR 上大规模迁移至 GPU
数据是现代业务的燃料,但依赖基于 CPU 的 Apache Spark 管道 会带来高昂的成本。这些系统天生速度较慢,需要庞大的基础设施,
3 MIN READ
2025年 12月 16日
使用 NVIDIA CUDA MPS 无需修改代码即可提升 GPU 显存性能
NVIDIA CUDA 开发者可以利用多种工具和库来简化开发与部署,使用户能够专注于应用程序的“内容”和“方式”。 多进程服务 (MPS)…
5 MIN READ
2025年 12月 15日
深入解析 NVIDIA Nemotron 3:使其高效精准的技术、工具与数据
代理式 AI 系统日益依赖协同运行的智能体集合,包含检索器、规划器、工具执行器、验证器等,它们需在大规模上下文上长时间协同工作。
2 MIN READ
2025年 12月 11日
采用 NVIDIA Spectrum-X 以太网的新一代 AI 工厂遥测
随着 AI 数据中心迅速演变为 AI 工厂,传统的网络监控方法已难以满足需求。工作负载日益复杂,基础设施快速扩展,
3 MIN READ
2025年 12月 11日
基于 NVIDIA Jetson 的边缘 AI 入门指南:面向机器人的大语言模型、视觉语言模型和基础模型
在小型、低功耗的边缘设备上运行先进的 AI 和计算机视觉工作流正变得越来越具有挑战性。机器人、智能摄像头和自主设备需要实时智能来感知、
2 MIN READ
2025年 12月 10日
更高效的漏洞检测:Compute Sanitizer 编译时插桩如何增强内存安全性
CUDA C++ 是一种带有扩展功能的标准 C++,支持函数在 GPU 的多个并行线程上执行。它在推动广泛应用的同时,
3 MIN READ
2025年 12月 10日
借助 NCCL Inspector 增强 AI 工作负载的通信可观测性
使用 NVIDIA 集合通信库 (NCCL) 运行包含集合运算(例如 AllReduce、
3 MIN READ
2025年 12月 8日
使用 NVFP4 KV 缓存优化大批次与长上下文推理
量化是大规模推理中的关键手段之一。通过降低权重、激活值和KV缓存的精度,可以有效减少内存占用和计算开销,从而显著提升推理吞吐量、降低延迟,
3 MIN READ
2025年 12月 5日
NVIDIA Grace CPU 为现代数据中心提供高带宽和高效率
自2023年首次发布以来,NVIDIA Grace CPU 在数据中心领域实现了快速普及,为多种工作负载的性能与能效树立了新的标杆。
3 MIN READ
2025年 12月 5日
NVIDIA Kaggle 大师夺冠人工智能竞赛
NVIDIA 的研究人员在周五的 Kaggle 竞赛中拔得头筹,这一赛事被业界许多人视为对人类在人工智能(AGI)领域进展的一次实时检验。
1 MIN READ
2025年 11月 25日
在 NVIDIA Jetson Thor 上提升机器人感知效率
借助 NVIDIA 视觉编程接口库(VPI),您可以更有效地利用 Jetson Thor 的计算性能。
4 MIN READ
2025年 11月 24日
模型量化:核心概念、实现方法与关键作用
随着 AI 模型日益复杂,往往超出可用硬件的承载能力,量化技术已成为应对这一挑战的关键手段,使资源密集型模型得以在受限的硬件上运行。
5 MIN READ
2025年 11月 24日
构建和运行安全的数据驱动型 AI 智能体
随着生成式 AI 的不断发展,企业组织对准确、可靠且基于自身特定业务数据的 AI 智能体的需求日益增长。
3 MIN READ
2025年 11月 12日
NVIDIA Blackwell 架构席卷 MLPerf Training v5.1 基准测试
NVIDIA Blackwell 架构在 MLPerf Training v5.1 的各项基准测试中均实现了更快的训练速度,
3 MIN READ
2025年 11月 10日
在 Kubernetes 上启用 NVIDIA GB200 NVL72 及以上型号的多节点 NVLink
NVIDIA GB200 NVL72 将 AI 基础设施提升至全新高度,在大语言模型训练以及可扩展、低延迟推理工作负载的运行方面实现显著突破。
4 MIN READ
2025年 11月 10日
如何将数学问题的推理速度提升 4 倍
大语言模型能够解决具有挑战性的数学问题。然而,若要实现其大规模高效运行,仅依靠一个强大的模型检查点还远远不够。
3 MIN READ