强化学习
2026年 5月 31日
如何使用 NVIDIA Alpamayo 在闭环中对自动驾驶车辆模型进行后训练
开发自动驾驶车辆(AV)政策需要弥合训练与部署之间的一个重要差距。
2 MIN READ
2026年 5月 20日
掌握智能体技术:AI 智能体定制
自主 AI 智能体 正承担着企业中的各种任务:规划物流车队路线、分类支持工单、生成代码以及编排多步骤工作流。
3 MIN READ
2025年 12月 15日
如何使用强化学习训练科学智能体
科学过程可能重复且繁琐,研究人员往往需要花费数小时深入研读论文、管理实验流程或整理庞大的多模态数据集。科学 AI 智能体能够承担大量繁重任务,
3 MIN READ
2020年 9月 1日
用非参数方法提高强化学习的样本效率
人工智能和自主学习的最新发展表明,在棋盘游戏和电脑游戏等任务中取得了令人印象深刻的成果。然而,学习技术的适用性主要局限于模拟环境。这种不适用于实际情况的一个主要原因是样本普遍效率低下,无法保证安全运行。。。
2 MIN READ