面向具身智能,强化学习连接感知、行动与环境反馈,支撑机器人在仿真和真实环境中交互学习与能力进化 … 主要从事人工智能、机器学习、强化学习方向的研究,工作获 5 项国际论文奖、3 项国际算法竞赛冠军 … 代表性成果包括多智能体强化学习算法 MAPPO(谷歌学术引用超 2800 次)、以及面向具身智能的大规模强化学习训练框架 RLinf(GitHub Star 超 2600)。
面向具身智能,强化学习连接感知、行动与环境反馈,支撑机器人在仿真和真实环境中交互学习与能力进化 … 主要从事人工智能、机器学习、强化学习方向的研究,工作获 5 项国际论文奖、3 项国际算法竞赛冠军 … 代表性成果包括多智能体强化学习算法 MAPPO(谷歌学术引用超 2800 次)、以及面向具身智能的大规模强化学习训练框架 RLinf(GitHub Star 超 2600)。