Yifei Song

Yifei Song 是 NVIDIA 的计算机架构师。他毕业于中国科学院大学。Yifei 专注于深度学习系统的端到端训练优化、分布式模型并行和 MLIR 编译器基础设施。

Posts by Yifei Song

数据科学

使用 AI 智能体自动翻译 GPU 内核:将 cuTile Python 转换为 cuTile.jl

NVIDIA CUDA Tile(cuTile)是一种基于图块的编程模型,可让开发者以图块为单位进行操作(如加载、存储和矩阵乘积累加), 3 MIN READ