Rakesh Madugundu

Rakesh Madugundu 是 Sarvam AI 的 ML 性能工程师。他专注于通过在系统和内核级别进行优化来加速模型推理，以降低生产延迟。他热衷于底层工程，特别热衷于编写自定义内核和从头开始构建基础架构，以更大限度地提高硬件效率。

Posts by Rakesh Madugundu

智能体/生成式 AI 2026年 2月 18日

随着全球人工智能采用的加速，开发者面临日益严峻的挑战：如何提供符合现实世界延迟和成本要求的大语言模型（LLM）性能。 4 MIN READ