CUDA
2026年 6月 1日
在 NVIDIA JetPack 7.2 中部署具有高显存效率的边缘代理就绪型 AI
随着 AI 智能体 从数字世界转向物理环境,他们可以轻松使用 NVIDIA Jetson,通过优化的内存和性能加速现实世界的部署。
3 MIN READ
2026年 5月 26日
借助 NVIDIA CompileIQ 自动调整功能提升内核性能
NVIDIA CompileIQ 解决了性能工程中最棘手的问题之一:找到为特定工作负载解锁最佳性能的编译器选项。 想象一下,
3 MIN READ
2026年 5月 26日
使用 NVIDIA CUDA Tile 在 C++ 中开发高性能 GPU 内核
开发者现在可以在现有的大型 C++ GPU 代码库中使用 NVIDIA CUDA Tile 编程,
6 MIN READ
2026年 5月 26日
NVIDIA CUDA 13.3 通过 C++ 中的平铺式编程、编译器自动调整和 Python 更新来增强 GPU 开发
NVIDIA CUDA 13.3 为整个 CUDA 生态系统的开发者带来了新功能和性能优化。通过在 C++ 中引入 NVIDIA CUDA…
4 MIN READ
2026年 5月 21日
借助 Slurm 拓扑感知型作业调度功能,在 NVIDIA GB200 NVL72 上实现百万兆级性能
随着AI模型的规模和复杂性持续提升,要充分发挥现代加速基础设施的性能,关键在于如何合理分配工作负载以及硬件的部署方式。
3 MIN READ
2026年 5月 21日
在电信 AI 工厂构建词元+ Metered AI 服务
全球各地的电信公司正基于主权AI工厂基于NVIDIA云合作伙伴(NCP)参考架构,建设,使政府、企业和初创公司能够以适当的控制力、
3 MIN READ
2026年 4月 22日
在 nvmath-python 中使用通用稀疏张量简化稀疏深度学习
在上一篇文章中,我们介绍了通用稀疏张量 (UST),使开发者能够将张量的稀疏性与其内存布局解,从而提高灵活性和性能。
4 MIN READ
2024年 7月 2日
使用 CRIU 实现 CUDA 应用程序检查点
CUDA 的检查点和恢复功能通过名为 cuda-checkpoint 的命令行实用程序公开,
3 MIN READ
2024年 6月 12日
在 cuBLAS 中引入分组 GEMM API 以及更多性能更新
最新版本 NVIDIA cuBLAS 库版本 12.5 将继续为深度学习(DL)和高性能计算(HPC)工作负载提供功能和性能。
2 MIN READ
2024年 5月 21日
使用 QUELO-G 和 CUDA 图进行量子力学增强型药物研发
在药物研发中,人们经常使用基于所谓经典力场的方法,并认为这些方法很有用。然而,人们也广泛认识到,力场模型中缺少一些重要的物理特性,
2 MIN READ
2024年 5月 14日
NVIDIA DeepStream 7.0 里程碑式发布,用于下一代视觉 AI 开发
NVIDIA DeepStream 是一个功能强大的 SDK,可以解锁 GPU 加速的构建块,以构建端到端的视觉 AI 管道。
3 MIN READ
2024年 5月 12日
NVIDIA CUDA-Q 新功能提升量子应用程序性能
NVIDIA CUDA-Q(前身为 NVIDIA CUDA Quantum)是一个开源编程模型,旨在构建 量子加速超级计算,充分发挥 CPU、
2 MIN READ
2024年 5月 10日
具有条件节点的 CUDA 图的动态控制流
CUDA 图 可以显著提高性能,因为驱动程序能够使用任务和依赖关系的完整描述来优化执行。特别是在静态工作流中,图形可以提供难以置信的好处,
2 MIN READ
2024年 3月 27日
高效的 CUDA 调试:将 NVIDIA Compute Sanitizer 与 NVIDIA 工具扩展程序结合使用并创建自定义工具
NVIDIA Compute Sanitizer 是一款功能强大的工具,可以节省时间和精力,同时提高 CUDA 应用程序的可靠性和性能。
5 MIN READ
2024年 3月 6日
CUDA 工具包 12.4 增强对 NVIDIA Grace Hopper 和机密计算的支持
最新版本的 CUDA 工具包,即 版本 12.4,继续利用最新的 NVIDIA GPU 来推动加速计算性能。
3 MIN READ
2024年 2月 28日
针对药物研发优化 OpenFold 训练
从氨基酸序列预测 3D 蛋白质结构一直是生物信息学领域由来已久的重要问题。近年来,基于深度学习的计算方法不断涌现,并已显示出有希望的结果。
2 MIN READ