Vedaanta Agarwalla

作为 NVIDIA 的高级深度学习软件工程师,Vedaanta Agarwalla 专注于加速 GPU 工作负载,目前专注于优化用于训练和推理的注意力内核。他之前的工作经历涵盖 ResNetoptimizations、GEMM 以及量化交易衍生品定价 HPC。Vedaanta 拥有伊利诺伊大学厄巴纳 - 香槟分校计算机科学硕士学位。

Posts by Vedaanta Agarwalla

智能体/生成式 AI

借助 NVIDIA Blackwell Ultra 提升 Softmax 的效率

LLM 上下文长度呈爆炸式增长,架构正朝着更复杂的注意力机制发展,例如多头潜在注意力(MLA)和分组查询注意力(GQA)。因此, 2 MIN READ