Zhaopeng Qiu

Zhaopeng Qiu 是 NVIDIA 的解决方案架构师，专门从事自然语言处理研究。他的研究领域包括大语言模型算法和强化学习系统。他拥有北京大学的硕士学位。

Posts by Zhaopeng Qiu

数据科学 2026年 4月 20日

随着 LLM 从简单的文本生成过渡到复杂的推理，强化学习 (RL) 发挥着核心作用。群相对策略优化 (GRPO) 等算法为这种转变提供动力， 3 MIN READ