Feng Xie

Feng Xie 是 NVIDIA 的高级总监,领导 AI 计算团队推动面向 AI 的前沿全栈计算加速技术 (从应用到库再到硬件架构) 。他的工作包括量化和模型压缩、框架优化、代码生成技术和新一代 GPU 硬件特征研究。

Posts by Feng Xie

开发与优化

通过 Python API 利用 CuTe DSL 实现 CUTLASS C++ 级性能

CuTe,是 CUTLASS 3.x 的核心组件,它提供了统一的代数体系,用于描述数据布局和线程映射, 4 MIN READ