CUDA

2026年 6月 1日

在 NVIDIA JetPack 7.2 中部署具有高显存效率的边缘代理就绪型 AI

随着 AI 智能体从数字世界转向物理环境，他们可以轻松使用 NVIDIA Jetson，通过优化的内存和性能加速现实世界的部署。

3 MIN READ

2026年 5月 26日

借助 NVIDIA CompileIQ 自动调整功能提升内核性能

NVIDIA CompileIQ 解决了性能工程中最棘手的问题之一：找到为特定工作负载解锁最佳性能的编译器选项。想象一下，

3 MIN READ

2026年 5月 26日

使用 NVIDIA CUDA Tile 在 C++ 中开发高性能 GPU 内核

开发者现在可以在现有的大型 C++ GPU 代码库中使用 NVIDIA CUDA Tile 编程，

6 MIN READ

2026年 5月 26日

NVIDIA CUDA 13.3 通过 C++ 中的平铺式编程、编译器自动调整和 Python 更新来增强 GPU 开发

NVIDIA CUDA 13.3 为整个 CUDA 生态系统的开发者带来了新功能和性能优化。通过在 C++ 中引入 NVIDIA CUDA…

4 MIN READ

2026年 5月 21日

借助 Slurm 拓扑感知型作业调度功能，在 NVIDIA GB200 NVL72 上实现百万兆级性能

随着AI模型的规模和复杂性持续提升，要充分发挥现代加速基础设施的性能，关键在于如何合理分配工作负载以及硬件的部署方式。

3 MIN READ

2026年 5月 21日

在电信 AI 工厂构建词元+ Metered AI 服务

全球各地的电信公司正基于主权AI工厂基于NVIDIA云合作伙伴（NCP）参考架构，建设，使政府、企业和初创公司能够以适当的控制力、

3 MIN READ

2026年 4月 22日

在 nvmath-python 中使用通用稀疏张量简化稀疏深度学习

在上一篇文章中，我们介绍了通用稀疏张量 (UST)，使开发者能够将张量的稀疏性与其内存布局解，从而提高灵活性和性能。

4 MIN READ

2024年 7月 2日

使用 CRIU 实现 CUDA 应用程序检查点

CUDA 的检查点和恢复功能通过名为 cuda-checkpoint 的命令行实用程序公开，

3 MIN READ

2024年 6月 12日

在 cuBLAS 中引入分组 GEMM API 以及更多性能更新

最新版本 NVIDIA cuBLAS 库版本 12.5 将继续为深度学习（DL）和高性能计算（HPC）工作负载提供功能和性能。

2 MIN READ

2024年 5月 21日

使用 QUELO-G 和 CUDA 图进行量子力学增强型药物研发

在药物研发中，人们经常使用基于所谓经典力场的方法，并认为这些方法很有用。然而，人们也广泛认识到，力场模型中缺少一些重要的物理特性，

2 MIN READ

2024年 5月 14日

NVIDIA DeepStream 7.0 里程碑式发布，用于下一代视觉 AI 开发

NVIDIA DeepStream 是一个功能强大的 SDK，可以解锁 GPU 加速的构建块，以构建端到端的视觉 AI 管道。

3 MIN READ

2024年 5月 12日

NVIDIA CUDA-Q 新功能提升量子应用程序性能

NVIDIA CUDA-Q（前身为 NVIDIA CUDA Quantum）是一个开源编程模型，旨在构建量子加速超级计算，充分发挥 CPU、

2 MIN READ

2024年 5月 10日

具有条件节点的 CUDA 图的动态控制流

CUDA 图可以显著提高性能，因为驱动程序能够使用任务和依赖关系的完整描述来优化执行。特别是在静态工作流中，图形可以提供难以置信的好处，

2 MIN READ

2024年 3月 27日

高效的 CUDA 调试：将 NVIDIA Compute Sanitizer 与 NVIDIA 工具扩展程序结合使用并创建自定义工具

NVIDIA Compute Sanitizer 是一款功能强大的工具，可以节省时间和精力，同时提高 CUDA 应用程序的可靠性和性能。

5 MIN READ

2024年 3月 6日

CUDA 工具包 12.4 增强对 NVIDIA Grace Hopper 和机密计算的支持

最新版本的 CUDA 工具包，即版本 12.4，继续利用最新的 NVIDIA GPU 来推动加速计算性能。

3 MIN READ

2024年 2月 28日

针对药物研发优化 OpenFold 训练

从氨基酸序列预测 3D 蛋白质结构一直是生物信息学领域由来已久的重要问题。近年来，基于深度学习的计算方法不断涌现，并已显示出有希望的结果。

2 MIN READ