-
Claude Opus 4.7 深度评测:最强编程模型,也逃不过翻车命运
写个复杂多文件项目改完还要自己逐行审查?Claude Opus 4.7 可能就是被寄望来解决这个问题的。SWE-bench Pro 拿了 64.3% 的分数,视觉识别从 54% 飙到 98% 接近完美,100 万 token 上下文确实能吞下整个代码库。但新 tokenizer 让成本悄悄涨了三四成,自适应推理也让不少老用户骂它变懒了。 简单说说 Claude Opus 4.7 是 Anthrop…- 50
- 0
-
GPT-5.5 评测:比 Claude 强多少?值不值价格翻倍?
一位做数据分析的朋友上周跟我吐槽,说 GPT-5.4 写代码写到一半总"犯傻",推理链断得莫名其妙。4月24日凌晨 OpenAI 突然甩出 GPT-5.5,号称"自 GPT-4.5 以来第一次完全重新预训练",定位不再是聊天机器人,而是专门干活的智能体引擎。用了几天之后我的感受是:它确实变聪明了,但代价也很真实。 先说说这是啥 GPT-5.5 不是 GPT-…- 45
- 0
-
AI大事件:Claude Opus 4.7再升级,梁文锋计划融资20亿,阿里、腾讯同日开源世界模型
今天我认真翻了翻AI圈的新消息,发现有几个变化挺有意思的——Anthropic这次直接把Claude Opus拉到了4.7,编码和Agent能力又上了一个台阶;具身智能那边,智元直接搞了2500人的合作伙伴大会,4款新本体现成亮相,这个赛道真的在加速;阿里的世界模型也出来了,视频编辑方向直接冲到了全球第一。数字层面上,中国日均词元调用量突破140万亿,Stanford的报告说中美模型差距只剩2.7…- 1.3k
- 0






