5 月的一个下午,在北京我们见到了银河通用机器人联合创始人兼大模型负责人张直政博士,他曾任微软研究院高级研究员,参与微软公司 Copilot、Token Mixers、Dynamics 3 让各式模型路线兼容并蓄,使不同具身数据各尽其用 … 这是一个在隐空间中统一世界模型与 VLA 的跨本体动作基础模型,首次在数据层面实现虚实共融、人机混合、质量参差、有无动作标签的数据统一有效利用 … VLA 模型直接学习策略,世界模型侧重预测环境的状态转移对环境状态进行建模,LDA 既学习”我该做什么”,又建模”环境会怎么变”,在一个统一的 Latent Space 里让二者协同训练、相互增益。

