LeCun 10 亿押注的方向,全球领先视觉大模型团队早已布局

不同于主流世界模型预测下一帧画面长什么样,隐空间世界模型要求 AI 在更抽象的表征空间里,学习动作和世界状态变化之间的因果规律 … 单个模型的成功还能归因于机会,那么连续做出 Grounding DINO、DINO-X 等这样的全球领先物体理解视觉基座大模型,更多说明的是团队底层能力已经成型 … 曾经做出世界第一视觉大模型的视启团队,正把同样的信念,押注在隐空间世界模型上。

原文连接