Vicki Wang

Vicki Wang 是 NVIDIA 的杰出工程师,专注于开发光速深度学习操作、超大规模内核以及在 GPU 上探索高效的代码生成技术。

Posts by Vicki Wang

开发与优化

通过 Python API 利用 CuTe DSL 实现 CUTLASS C++ 级性能

CuTe,是 CUTLASS 3.x 的核心组件,它提供了统一的代数体系,用于描述数据布局和线程映射, 4 MIN READ