显存
2026年 3月 9日
CUDA 13.2 引入增强的 CUDA Tile 支持和新的 Python 功能
CUDA 13.2 发布后进行了重大更新:NVIDIA CUDA Tile 现已支持具有 8.X 架构 ( NVIDIA Ampere 和…
5 MIN READ
2026年 2月 19日
借助 NVIDIA 多实例 GPU 和 NUMA 节点定位加速数据处理
NVIDIA Ampere、NVIDIA Hopper 和 NVIDIA Blackwell 系列中的 NVIDIA 旗舰数据中心 GPU…
3 MIN READ
2019年 8月 2日
GPUDirect 存储器:存储器和 GPU 存储器之间的直接路径
随着 AI 和 HPC 数据集的大小不断增加,加载给定应用程序的数据所花费的时间开始对整个应用程序的性能造成压力。在考虑端到端应用程序性能时,
5 MIN READ
2013年 1月 28日
在 CUDA C / C ++ 中使用共享内存
在 上一篇文章 中,我研究了如何将一组线程访问的全局内存合并到一个事务中,以及对齐和跨步如何影响 CUDA 各代硬件的合并。
2 MIN READ
2013年 1月 13日
如何在 CUDA C/C++ 内核中高效访问全局内存
在前面的 两 文章 中,我们研究了如何在主机和设备之间高效地移动数据。在我们的 CUDA C / C ++系列的第六篇文章中,
3 MIN READ
2012年 12月 13日
如何在 CUDA C/C++ 中实现数据传输的重叠
在上一期的 C / C ++ 文章 中,我们讨论了如何在主机和设备之间高效地传输数据。在这篇文章中,我们讨论了如何将数据传输与主机上的计算、
3 MIN READ
2012年 12月 4日
如何在 CUDA C / C ++ 中优化数据传输
在 C + C ++系列 之前的 帖子 中,我们为该系列的主要推力奠定了基础:如何优化 CUDA C / C ++代码。
3 MIN READ