Guyue Huang

Guyue Huang 是 NVIDIA 的深度学习架构师，专门从事后训练 RL 性能。她为许多开源 LLM 训练库 (例如 NeMo-RL 和 Megatron-LM) 做出了贡献。她获得了加州大学圣克拉拉分校的博士学位。

Posts by Guyue Huang

数据科学 2026年 4月 20日

随着 LLM 从简单的文本生成过渡到复杂的推理，强化学习 (RL) 发挥着核心作用。群相对策略优化 (GRPO) 等算法为这种转变提供动力， 3 MIN READ