全部标签

Claude Opus 4.7

Claude Opus 4.7 深度评测：最强编程模型，也逃不过翻车命运

写个复杂多文件项目改完还要自己逐行审查？Claude Opus 4.7 可能就是被寄望来解决这个问题的。SWE-bench Pro 拿了 64.3% 的分数，视觉识别从 54% 飙到 98% 接近完美，100 万 token 上下文确实能吞下整个代码库。但新 tokenizer 让成本悄悄涨了三四成，自适应推理也让不少老用户骂它变懒了。简单说说 Claude Opus 4.7 是 Anthrop…
AI工具
- 87
- 0
龙虾就酒5月1日
GPT-5.5 评测：比 Claude 强多少？值不值价格翻倍？

一位做数据分析的朋友上周跟我吐槽，说 GPT-5.4 写代码写到一半总"犯傻"，推理链断得莫名其妙。4月24日凌晨 OpenAI 突然甩出 GPT-5.5，号称"自 GPT-4.5 以来第一次完全重新预训练"，定位不再是聊天机器人，而是专门干活的智能体引擎。用了几天之后我的感受是：它确实变聪明了，但代价也很真实。先说说这是啥 GPT-5.5 不是 GPT-…
AI工具
- 70
- 0
半岛铁箱4月29日
AI大事件：Claude Opus 4.7再升级，梁文锋计划融资20亿，阿里、腾讯同日开源世界模型

今天我认真翻了翻AI圈的新消息，发现有几个变化挺有意思的——Anthropic这次直接把Claude Opus拉到了4.7，编码和Agent能力又上了一个台阶；具身智能那边，智元直接搞了2500人的合作伙伴大会，4款新本体现成亮相，这个赛道真的在加速；阿里的世界模型也出来了，视频编辑方向直接冲到了全球第一。数字层面上，中国日均词元调用量突破140万亿，Stanford的报告说中美模型差距只剩2.7…
AI日报
- 1.3k
- 0
老曹4月18日