谷歌再发香蕉！通用视觉模型Vision Banana刷新2D/3D多项SOTA

2026-4-25 18:30:55

一个Banana不够，再来一个！

谷歌DeepMind以Nano Banana Pro为底座，最新发布通用版香蕉通用多模态视觉大模型Vision Banana

证明图像生成预训练，可以成为通用视觉学习的统一范式。

一个通用模型，零样本迁移下，击败SAM 3、Depth Anything 3等专用模型，分割、深度、法线核心任务刷新多项SOTA。

就像LLM用文本生成统一所有NLP任务一样，视觉领域的LLM时刻，可能真的来了。

领域正发生重大变革，Vision Banana将彻底改写这类视觉问题的解决方式。

圈主管理员

热门评论

该帖子评论已关闭

图片审查中...

编辑答案：我的回答：最多上传一张图片和一个附件

表情

图片

附件

取消编辑

{{userData.name}}已认证