Oleg Rybakov

Oleg Rybakov 是 NVIDIA 的高级深度学习工程师。他致力于在训练前后提高深度学习模型的性能。他拥有电气工程博士学位。

Posts by Oleg Rybakov

数据科学

使用端到端 FP8 精度运行高吞吐量强化学习训练

随着 LLM 从简单的文本生成过渡到复杂的推理,强化学习 (RL) 发挥着核心作用。群相对策略优化 (GRPO) 等算法为这种转变提供动力, 3 MIN READ