全部标签

代码生成

OpenAI Codex 深度评测：从代码补全到全栈开发工作站

写代码还要自己在 IDE、终端、浏览器之间来回切？OpenAI Codex 直接把这条路走通了。它不止是代码补全，更像一个异步工程师队友，你丢任务给它，它排队做。2026 年 4 月的"Codex for (almost) everything"更新加入 Mac 桌面操控、持久记忆、图像生成和 90+ 插件，直接从编程工具膨胀成全栈工作站。底薪 $20/月就能用，但高 toke…
AI工具
- 969
- 0
半岛铁箱7月6日
GLM-5.1 深度评测：全球第一的开源模型，到底强在哪

写个复杂点的工程代码，来回折腾好几个小时还没跑通？GLM-5.1 可能是来治这个病的。SWE-Bench Pro 直接跑到 58.4 分，把 GPT-5.4 和 Claude Opus 4.6 都压了一头。更夸张的是能干 8 小时长程任务不需要你盯着。MIT 协议全量开源，价格只有 Opus 的八分之一。但推理速度偏慢、复杂重构不如 Opus 稳，这些短板也得说清楚。产品概述 GLM-5.1 是…
AI工具
- 461
- 0
灌篮菜鸟5月6日
Claude Opus 4.7 深度评测：最强编程模型，也逃不过翻车命运

写个复杂多文件项目改完还要自己逐行审查？Claude Opus 4.7 可能就是被寄望来解决这个问题的。SWE-bench Pro 拿了 64.3% 的分数，视觉识别从 54% 飙到 98% 接近完美，100 万 token 上下文确实能吞下整个代码库。但新 tokenizer 让成本悄悄涨了三四成，自适应推理也让不少老用户骂它变懒了。简单说说 Claude Opus 4.7 是 Anthrop…
AI工具
- 87
- 0
龙虾就酒5月1日