Zhengyi Zhang

Zhengyi Zhang 是 NVIDIA 的计算机架构实习生。他目前是复旦大学的博士生。Zhengyi 的研究领域包括深度学习推理优化、高性能内核开发和用于深度学习工作负载的编译技术。

Posts by Zhengyi Zhang

数据科学

使用 AI 智能体自动翻译 GPU 内核:将 cuTile Python 转换为 cuTile.jl

NVIDIA CUDA Tile(cuTile)是一种基于图块的编程模型,可让开发者以图块为单位进行操作(如加载、存储和矩阵乘积累加), 3 MIN READ