全部标签

大模型对比

MiniMax M3 评测：技术硬刚全球顶尖，商业化却让开发者炸了

一个开源模型，自己读论文、写代码、跑实验，全程搞了 12 个小时，把一篇 ICLR 顶会论文成功复现了。这就是刚发布的 MiniMax M3，三项前沿能力集于一身，评测分数直接干翻了 Claude Opus 4.7。但开发者社区的反应却炸了锅，不是因为能力不行，而是定价策略在发布当天翻了车。这是什么模型 MiniMax M3 是稀宇科技在 2026 年 6 月 1 日发布的新一代旗舰大模型。它的…
AI工具
- 662
- 0
AI情报员6月1日
LMArena 评测：最大的 AI 模型盲测竞技场，谁强谁弱用户说了算

选大模型像开盲盒？ChatGPT、Claude、Gemini 都说自己最强，到底信谁？LMArena 的玩法很直接，把你的问题丢进去，两个匿名模型同时回答，你投票选更好的那个。420 万+ 真实用户投票撑起的 Elo 排行榜，覆盖文本、代码、图像、视频 9 大能力维度。从伯克利实验室走出来的开源项目，现在估值 17 亿美元。到底值不值得信，上手投几票就知道了。产品概述 LMArena（原名 Ch…
AI工具
- 84
- 0
灌篮菜鸟5月18日