Allen Zhao

Allen Zhao 是一名高级计算架构工程师,专门研究前沿 AI 编译器技术,包括图级和图层级编译。他的专长在于优化各种硬件架构 (尤其是 GPGPU) 中 AI 模型的执行效率。他热衷于将编译器的理论进展转化为实用、高影响力的解决方案,用于新一代人工智能。拥有上海交通大学硕士学位。

Posts by Allen Zhao

智能体/生成式 AI

在 NVIDIA CUDA Tile 中调整 Flash Attention 以实现峰值性能

在本文中,我们将深入探讨现代 AI 中至关重要的工作负载之一:Flash Attention,您将了解: 环境要求: 9 MIN READ