2026 智源大会议程公开丨强化学习论坛

AI
5月20日

强哥来了

面向具身智能，强化学习连接感知、行动与环境反馈，支撑机器人在仿真和真实环境中交互学习与能力进化 … 主要从事人工智能、机器学习、强化学习方向的研究，工作获 5 项国际论文奖、3 项国际算法竞赛冠军 … 代表性成果包括多智能体强化学习算法 MAPPO（谷歌学术引用超 2800 次）、以及面向具身智能的大规模强化学习训练框架 RLinf（GitHub Star 超 2600）。

顶踩