Brandon Sun

Brandon Sun 是 NVIDIA 的高级软件工程师,目前专注于 GPU 上的光线性代数计算速度。Brandon 拥有多年的 GPU 软件堆栈多层工作经验,包括真实世界的 GPU 应用程序追踪、GPU 仿真和工具。

Posts by Brandon Sun

开发与优化

通过 Python API 利用 CuTe DSL 实现 CUTLASS C++ 级性能

CuTe,是 CUTLASS 3.x 的核心组件,它提供了统一的代数体系,用于描述数据布局和线程映射, 4 MIN READ