Ivan Yin

Ivan Yin 是一名高级计算机架构工程师,专门从事 GPU 编译器工程和高性能深度学习。他毕业于上海交通大学。他在 NVIDIA CUDA Tile 编程的编译器开发方面拥有专业知识,通过为现代 GPU 架构自动生成代码,将高级张量运算映射到高效 GPU 机器代码。除了编译器工程之外,他还在高性能深度学习内核开发和性能调优方面拥有丰富经验。

Posts by Ivan Yin

智能体/生成式 AI

在 NVIDIA CUDA Tile 中调整 Flash Attention 以实现峰值性能

在本文中,我们将深入探讨现代 AI 中至关重要的工作负载之一:Flash Attention,您将了解: 环境要求: 9 MIN READ