Alessandro Morari

Alessandro Morari 是 NVIDIA DevTech AI 组织的 AI 系统负责人。他目前专注于 AI 驱动的 GPU 内核和用于加速计算的新一代编程模型。从 GPU 内核优化到领先的 AI 产品,他的经验涵盖了整个 AIstack 领域。加入 NVIDIA 之前,他曾是 IBM Research 团队成员,负责交付 Watson Code Assistant,这是最早的大规模生成式 AI 产品之一。他曾为 Summit 和 Sierra 超级计算机开发系统软件,并开设了纽约大学 Courant 的第一门高性能机器学习课程。Morari 撰写了 30 多篇出版物,拥有 15 项专利,并获得了计算机架构博士学位。

Posts by Alessandro Morari

智能体/生成式 AI

在 NVIDIA CUDA Tile 中调整 Flash Attention 以实现峰值性能

在本文中,我们将深入探讨现代 AI 中至关重要的工作负载之一:Flash Attention,您将了解: 环境要求: 9 MIN READ