复旦邱锡鹏团队提出「上下文世界建模」:无需微调,VLA即可适应新环境

视觉-语言-动作(VLA) 模型,在部署时往往会遇到一个问题:一旦相机视角、安装位置或机器人形态稍有变化,性能就可能会下降。 以往的 “上下文学习”(In-Context Learning ) ,通常把上下文当作示范,靠人工演示任务执行,机器人并不知道整套系统该如何运作。一旦部署环境改变,研究人员往往只能 重新收集数据、重新调模型 ,既费时也费力。 针对这一问题,复旦大学邱锡鹏教授团队提出了 “上下文世界建模” (In-Context World Modeling,ICWM)。在任务执行前,机器人会进行一小段与任务无关的随机探测,再将 交互过程 作为 上下文输入模型 ,以此判断整套系统如何运作。

圈主 管理员

热门评论
:
该帖子评论已关闭
图片审查中...
编辑答案: 我的回答: 最多上传一张图片和一个附件
x
x