就在开发者社区还在讨论各家春节期间的更新时,谷歌深夜放出了新一代模型底座u0026mdash;u0026mdash;Gemini 3.1 Pro。谷歌表示,从去年11月至今,用户真实的反馈,都加速了每一次的研发迭代。
相比去年11月发布的 Gemini 3 Pro,这次版本号只增加了“0.1”,但从官方披露的测试结果来看,3.1Pro在多模态生成和深度推理上跃升了一大步。
最直观的变化来自推理能力的跃升。在ARC-AGI-2测试中,Gemini 3.1 Pro得分达到77.1%,而Gemini 3 Pro为31.1%,性能直接翻倍以上。在衡量跨学科复杂问题能力的 Humanityu0026rsquo;s Last Exam 中,Gemini 3.1 Pro得分44.4%,不仅高于前代的37.5%,也超过了GPT-5.2的34.5%。

