Aditya Vavre

Aditya Vavre 是 NVIDIA 的深度学习算法工程师,专注于推进高效的大规模语言模型训练和架构设计。他过去的工作包括 4 位和 8 位 LLM 预训练、量化感知训练和蒸馏以及稀疏注意力机制,从而实现更高效的长上下文和大规模 Transformer 模型。在加入 NVIDIA 之前,他在 Sony 担任研究工程师期间,为 NLP 和 AI 应用的研究和开发做出了贡献,构建了基于检索的对话系统和文本到视频生成流程。Aditya 拥有德克萨斯大学奥斯汀分校计算机科学硕士学位和印度理工学院孟买分校学士学位。他的研究领域涉及可扩展深度学习系统、模型效率和新一代基础模型架构。

Posts by Aditya Vavre

智能体/生成式 AI

采用 NVFP4 低精度训练提升吞吐量,兼顾精度无损

随着 AI 模型和数据集规模的不断扩大,仅依赖更高精度的 BF16 训练已难以满足需求。训练吞吐量预期、内存限制以及成本上升等关键挑战, 3 MIN READ