Parth Mannan

Parth Mannan 是 NVIDIA 高级深度学习性能工程师,专门从事端到端训练性能分析和优化。硕士毕业于佐治亚理工学院电气与计算机工程专业。

Posts by Parth Mannan

智能体/生成式 AI

借助动态上下文并行和 NVIDIA Megatron Core 加速可变长度训练

本文介绍了应用于 NVIDIA Megatron Core 中的一种新型调度方法 — — 动态上下文并行 (Dynamic-CP) , 4 MIN READ