CUDA C/ C++
2013年 1月 28日
在 CUDA C / C ++ 中使用共享内存
在 上一篇文章 中,我研究了如何将一组线程访问的全局内存合并到一个事务中,以及对齐和跨步如何影响 CUDA 各代硬件的合并。
2 MIN READ
2013年 1月 13日
如何在 CUDA C/C++ 内核中高效访问全局内存
在前面的 两 文章 中,我们研究了如何在主机和设备之间高效地移动数据。在我们的 CUDA C / C ++系列的第六篇文章中,
3 MIN READ
2012年 12月 13日
如何在 CUDA C/C++ 中实现数据传输的重叠
在上一期的 C / C ++ 文章 中,我们讨论了如何在主机和设备之间高效地传输数据。在这篇文章中,我们讨论了如何将数据传输与主机上的计算、
3 MIN READ
2012年 12月 4日
如何在 CUDA C / C ++ 中优化数据传输
在 C + C ++系列 之前的 帖子 中,我们为该系列的主要推力奠定了基础:如何优化 CUDA C / C ++代码。
3 MIN READ
2012年 11月 1日
如何在 CUDA C/C++ 中实现性能度量
在 本系列文章的第一篇 中,我们通过检查 CUDA C/C++ SAXPY 来研究 CUDA C / C ++的基本元素。在第二篇文章中,
2 MIN READ