国产第一:阿里 Qwen3.7-Max 模型 AI 编程能力超 Claude Opus 4.6

全球权威三方编程榜单 Code Arena 昨日(5 月 25 日)更新榜单,阿里旗舰模型 Qwen3.7-Max 得分 1541 分,仅次于 Claude 系列,在大模型厂商中排名全球第二 … 该榜单不测试学术化的选择题,而是评估模型在生成、调试、重构复杂代码时的实际编程能力,此外为防止刷榜(Anti-Gaming),采用用户随机盲测,模型无法提前获知考题,让模型必须具有真实的硬核代码生成能力 … 阿里 Qwen3.7-Max 模型的编程能力已超过 claude-opus-4-6 模型,并超过了 glm-5.1、kimi-k2.6 模型。

原文连接