开发工具与技巧
2025年 12月 17日
利用 NVIDIA Aerial Omniverse 数字孪生精准模拟无线电环境
5G 和 6G 的发展需要高保真无线电信道建模,但当前生态系统高度分散。链路级模拟器、网络级模拟器与 AI 训练框架通常采用不同的编程语言,
5 MIN READ
2025年 12月 17日
利用 Aether 项目将 Apache Spark 工作负载在 Amazon EMR 上大规模迁移至 GPU
数据是现代业务的燃料,但依赖基于 CPU 的 Apache Spark 管道 会带来高昂的成本。这些系统天生速度较慢,需要庞大的基础设施,
3 MIN READ
2025年 12月 17日
NVIDIA CUDA-Q QEC 中的实时解码、算法 GPU 解码器和 AI 推理增强功能
实时解码对于容错量子计算机至关重要。通过使解码器与量子处理器(QPU)同时以低延迟运行,我们能在相干时间内对设备施加校正,从而防止错误累积,
2 MIN READ
2025年 12月 16日
使用 NVIDIA CUDA MPS 无需修改代码即可提升 GPU 显存性能
NVIDIA CUDA 开发者可以利用多种工具和库来简化开发与部署,使用户能够专注于应用程序的“内容”和“方式”。 多进程服务 (MPS)…
5 MIN READ
2025年 12月 16日
塑造 2025 年的 AI 工厂、物理 AI 以及模型、智能体和基础设施的进步
对于使用 NVIDIA 技术的开发者和研究人员而言,2025 年是又一个具有里程碑意义的年份。在数据中心功耗与计算设计、AI 基础设施、
3 MIN READ
2025年 12月 16日
cuQuantum SDK v25.11 中的先进大规模量子模拟技术
随着量子处理器 (QPU) 性能的提升,模拟大规模量子计算机变得愈发困难。验证结果是确保在设备规模超出经典可模拟范围后,
4 MIN READ
2025年 12月 12日
如何使用合成数据构建隐私保护评估基准
验证 AI 系统需要基准测试(模拟现实世界条件的数据集和评估工作流程),以便在部署前衡量其准确性、可靠性和安全性。缺少这些测试,
4 MIN READ
2025年 12月 12日
如何在现代 NVIDIA GPU 架构上扩展快速里叶变换以实现百亿亿次级计算
快速里叶变换 (FFT) 广泛应用于科学计算,涵盖分子动力学、信号处理、计算流体动力学 (CFD)、无线多媒体以及机器学习等领域。
4 MIN READ
2025年 12月 10日
更高效的漏洞检测:Compute Sanitizer 编译时插桩如何增强内存安全性
CUDA C++ 是一种带有扩展功能的标准 C++,支持函数在 GPU 的多个并行线程上执行。它在推动广泛应用的同时,
3 MIN READ
2025年 12月 10日
借助 NCCL Inspector 增强 AI 工作负载的通信可观测性
使用 NVIDIA 集合通信库 (NCCL) 运行包含集合运算(例如 AllReduce、
3 MIN READ
2025年 12月 9日
借助 NVIDIA Aerial Omniverse 数字孪生改进 AI 原生 6G 设计
AI原生的6G网络将为数十亿的智能设备、智能体和机器提供服务。随着行业拓展至FR3(7–24 GHz)等新频段,无线电物理特性变得更加敏感,
2 MIN READ
2025年 12月 9日
五大 AI 模型优化技术,实现更快速、更智能的推理
随着 AI 模型规模不断扩大,架构日益复杂,研究人员和工程师正持续探索新技术,以优化 AI 系统在生产环境中的性能并降低总体成本。
2 MIN READ
2025年 12月 8日
使用 NVSentinel 自动监控 Kubernetes AI 集群健康状态
Kubernetes 支持生产环境中绝大多数 AI 工作负载。然而,维护 GPU 节点、保障应用稳定运行、持续推进训练任务,
2 MIN READ
2025年 12月 5日
NVIDIA Kaggle 大师夺冠人工智能竞赛
NVIDIA 的研究人员在周五的 Kaggle 竞赛中拔得头筹,这一赛事被业界许多人视为对人类在人工智能(AGI)领域进展的一次实时检验。
1 MIN READ
2025年 12月 4日
借助功率配置文件优化 AI 和 HPC 工作负载的数据中心效率
不断呈指数级增长的计算需求正推动功耗持续上升,使数据中心面临巨大压力。在设施功耗受限的背景下,提升每瓦功耗的计算性能,
2 MIN READ
2025年 12月 4日
专注于你的算法——让 NVIDIA CUDA Tile 来处理硬件细节
NVIDIA CUDA 13.1 推出 NVIDIA CUDA Tile,这是自 2006 年 NVIDIA CUDA 平台发明以来,
2 MIN READ