-
MiniMax M3 评测:技术硬刚全球顶尖,商业化却让开发者炸了
一个开源模型,自己读论文、写代码、跑实验,全程搞了 12 个小时,把一篇 ICLR 顶会论文成功复现了。这就是刚发布的 MiniMax M3,三项前沿能力集于一身,评测分数直接干翻了 Claude Opus 4.7。但开发者社区的反应却炸了锅,不是因为能力不行,而是定价策略在发布当天翻了车。 这是什么模型 MiniMax M3 是稀宇科技在 2026 年 6 月 1 日发布的新一代旗舰大模型。它的…- 662
- 0
-
LMArena 评测:最大的 AI 模型盲测竞技场,谁强谁弱用户说了算
选大模型像开盲盒?ChatGPT、Claude、Gemini 都说自己最强,到底信谁?LMArena 的玩法很直接,把你的问题丢进去,两个匿名模型同时回答,你投票选更好的那个。420 万+ 真实用户投票撑起的 Elo 排行榜,覆盖文本、代码、图像、视频 9 大能力维度。从伯克利实验室走出来的开源项目,现在估值 17 亿美元。到底值不值得信,上手投几票就知道了。 产品概述 LMArena(原名 Ch…- 84
- 0




