Posts by Rajeshwari Devaramani
开发与优化
2025年 9月 29日
释放 GPU 性能:CUDA 中的全局内存访问
管理内存是编写 GPU 内核时影响性能的关键因素之一。本文将为您介绍全局内存及其对性能影响的重要知识。 CUDA 设备上存在多种类型的显存,
4 MIN READ
模拟/建模/设计
2025年 8月 4日
CUDA 专业提示:通过矢量化内存访问提高性能
许多 CUDA 内核受带宽限制,新硬件中 FLOPS 与带宽的比例不断增加,导致更多内核受带宽限制。因此,
2 MIN READ