Ximing Lu

Ximing Lu 是 NVIDIA 语言和认知研究团队的研究科学家。她曾在华盛顿大学获得计算机科学学士学位。她的研究兴趣围绕数据合成、强化学习、智能体系统、模型架构和多模态。她是 NAACL 2022 最佳论文奖和 EMNLP 2023 杰出论文奖的共同获奖者。

Posts by Ximing Lu

代理式 AI/生成式 AI

借助 BroRL 中的扩展功能突破强化学习训练限制

在使用可验证奖励的强化学习(RL)训练大语言模型(LLM)时,一个极具挑战性的问题是如何突破性能瓶颈。 2 MIN READ
数据科学

使用 ProRL v2 通过长时间训练扩展 LLM 强化学习

目前,AI 领域最引人注目的问题之一是大型语言模型 (LLM) 是否可以通过持续强化学习 (RL) 继续改进,或者其能力是否最终会达到顶峰。 4 MIN READ