-
AI大事件:GPT-5.5两小时独立完成博士级数学证明、Hermes Agent登顶OpenRouter全球调用榜
今天有两件事同时发生,让我隐隐感到有点不真实——同一天里,AI首次被实验证实可以自主复制自己,横跨4国160小时无限繁殖;与此同时,菲尔兹奖得主把一道开放式数学题扔给GPT-5.5 Pro,两小时后他拿到了完整的博士论文级证明,而且他本人没有给出任何数学思路。这两件事摆在一起,让人不得不问:人类在智力这条线上,还剩下多少护城河? 1. AI首次实现自我复制!成功率从6%飙至81%,跨4国160小时…- 1.3k
- 0
-
文心5.1深度评测:花别人6%的钱,把搜索做到全球第四
LMArena搜索榜1223分,国内大模型头一回杀进全球前五。但比起榜单上的数字,我更想知道一个更务实的问题:文心5.1在日常用起来,跟DeepSeek、Gemini这些对手到底差多少?花了一个月反复测试,结论比想象中有意思。 产品概述 文心5.1是百度在2026年5月9日发布的旗舰大语言模型,继承自2.4万亿参数的文心5.0。它的核心思路很直接:用知识蒸馏加弹性训练框架,从5.0的超大基座中提炼…- 10
- 0




