都在卷「让大模型多循环几遍」，这个7B模型LoopCoder v2说：多循环 1 次就够了

2026-7-1 16:20:44

当所有人都在比谁「想得更久、算得更多」——推理模型动辄输出成千上万个思考 token，循环式架构恨不得在内部反复迭代十遍八遍——一项新研究反手泼了盆冷水：一个 7B 的小模型，只需要在正常计算之外「多循环这一次」（总共 2 次），就能在号称最难的真实代码修复基准 SWE-bench Verified 上从 43.0 分飙到 64.4 分；一、「循环」，当下最热的卷法自从 o1、Claude 这一代推理模型把「想得越久越强」写进行业共识，「测试时计算」（test-time compute）就成了过去一年最热的方向：与其把模型练得更大，不如让它在推理时多花点算力，把答案反复打磨。

圈主管理员

热门评论

该帖子评论已关闭

图片审查中...

编辑答案：我的回答：最多上传一张图片和一个附件

表情

图片

附件

取消编辑

{{userData.name}}已认证

都在卷「让大模型多循环几遍」，这个7B模型LoopCoder v2说：多循环 1 次就够了

偷瞄答案

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议

{{userData.name}}已认证

都在卷「让大模型多循环几遍」，这个7B模型LoopCoder v2说：多循环 1 次就够了

偷瞄答案

您还未加入该AI圈子

相似站点

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议