阿里发布千问 Qwen3.7-Max 模型:国产最佳,可全自主完成 35 小时长程任务

阿里巴巴发布新一代千问旗舰模型 Qwen3.7-Max,在三方机构 Arena 全球大模型盲测总榜中,Qwen3.7-Max 超过 Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与 GPT、Claude、Gemini 最强模型接近,位列国产模型第一 … 千问 3.7 面向当下智能体(Agent)全新设计,实现了编程、推理等核心能力的持续突破,甚至可全自主完成 35 小时的超长程智能体复杂任务:在一个全新的芯片平台上,Qwen3.7-Max 通过自主编程和超 1000 次工具调用,实现了一个关键内核的自我进化,推理速度较原版本提升 10 倍 … 在评估 AI 解决真实世界的实战编程任务 SWE-bench 系列测评、面向真实科学问题的编程测评 SciCode 中,Qwen3.7-Max 较 Qwen3.6-Plus 大幅提升,并超越了 Claude Opus 4.6-Max、Kimi-K2.6、DeepSeek-v4-Pro-Max 等模型。

原文连接