Rakesh Madugundu

Rakesh Madugundu 是 Sarvam AI 的 ML 性能工程师。他专注于通过在系统和内核级别进行优化来加速模型推理,以降低生产延迟。他热衷于底层工程,特别热衷于编写自定义内核和从头开始构建基础架构,以更大限度地提高硬件效率。

Posts by Rakesh Madugundu

智能体/生成式 AI

NVIDIA 极致软硬件协同设计如何助力 Sarvam AI 主权模型实现惊人推理性能跃升

随着全球人工智能采用的加速,开发者面临日益严峻的挑战:如何提供符合现实世界延迟和成本要求的大语言模型(LLM)性能。 4 MIN READ