Md Fahim Faysal Khan

Md Fahim Faysal Khan 是 NVIDIA 的高级 LLM 性能工程师,负责大规模语言模型的端到端训练性能。他拥有宾夕法尼亚州立大学电气工程博士学位和孟加拉国工程与技术大学 (BUET) 学士学位。

Posts by Md Fahim Faysal Khan

智能体/生成式 AI

在 JAX 和 XLA 中加速长上下文模型训练

大语言模型(LLM)的上下文窗口正在迅速扩展,近期的模型已支持128K、256K甚至更长的词元序列。然而, 3 MIN READ