小米 MiMo Studio 测评:雷总家的”龙虾”到底香不香?

大模型赛道又多了一张牌,雷总亲自站台的小米 MiMo。从 2025 年 12 月低调上线到现在迭代到 V2.5 系列,半年时间版本号窜得比手机还快。看了参数觉得挺唬人,1T 总参的 MoE 架构、Claw-Eval 全球第三。但网页版用了一个多月下来,有些地方确实香,有些地方也真的让人抓狂。用大白话说说,这东西到底哪些人该冲、哪些人继续围观。

产品概述

Xiaomi MiMo Studio 是小米公司推出的在线 AI 对话与创作平台,2025 年 12 月 16 日正式上线。内核是小米自研的 MiMo 系列大语言模型,目前已经迭代到 V2.5 系列。它不是一个单一产品,而是一个以模型能力为底座、涵盖了对话、代码、多模态、语音、Agent 等多个维度的 AI 生态入口。

团队由原 DeepSeek 核心成员罗福莉带队,节奏很快,从 V2 Flash 到 V2.5 Pro,半年内连发十余款模型。MiMo-V2.5-Pro 采用 1T 总参 MoE 架构(42B 激活),原生支持 1M 超长上下文,在 Artificial Analysis 综合智能指数榜上拿了全球开源第一,Claw-Eval 智能体基准测试排到第三。

跟国内大多数 AI 产品的”对话加搜索”模式不同,MiMo Studio 走的是模型全家桶路线:一个网站里集成了通用对话、Agent 执行(MiMo Claw)、编程助手(MiMo Code)、语音合成、语音识别、文档处理(联名金山 WPS),还可以通过 API 接进 Claude Code、Cursor 等开发工具。定位上,它更像一个正在往”超级入口”方向长的 AI 平台,而不是单纯的聊天工具。

官网:https://mimo.xiaomi.com | 项目地址:https://github.com/xiaomimimo/MiMo

小米 MiMo Studio 测评:雷总家的"龙虾"到底香不香?

核心功能实测

定位是骨架,功能才是血肉,来看看它的硬实力到底撑不撑得住这个野心。

MiMo Studio 的功能按使用场景大概可以切成四块:对话推理、多模态理解、Agent 执行、开发者工具。每块的深度参差不齐,但有几项确实让人眼前一亮。

智能对话与深度推理。这是所有 AI 产品的标配,但 MiMo 做的风格偏务实。你问一个逻辑题,它不会一上来就甩结论,而是先拆问题再分析。实测经典的”洗车该走路还是开车去”,MiMo V2.5 Pro 没被绕进去,直接点出”要洗的是车,不是人,车必须开过去”。这种不耍花活的路子比某些模型的”过度思考”要舒服。深度搜索模式下,它会联网检索并标注来源链接,但检索质量不太稳定,偶尔会引用错误信息。

多模态理解。V2.5 标准版支持图片、视频、音频输入。你丢一张模糊的 Switch 照片过去,logo 都被挡住了,它能准确识别是 Switch OLED 版。上传一份医院的检查报告图,它能读出具体指标并给出解释。这个能力对日常场景很实用,比如拍照问菜谱、截图问代码报错。V2.5 Pro 暂时不支持多模态输入,这算是个让人在意的小区别。

小米 MiMo Studio 测评:雷总家的"龙虾"到底香不香?

MiMo Claw(AI Agent)。这是 MiMo 体系里最有想象力的部分。你可以给”龙虾”下达复杂任务,比如”搜一下今天科技新闻,总结十条,用 90 年代杂志风格生成一张海报”。Claw 会自己规划步骤、调用联网搜索、生成排版。实测一把苹果财报分析,28 页英文 PDF 丢进去,几分钟内就给出了分项数据摘要和五点结论。另一个让很多人惊喜的功能是 PPT 美化:丢进一个排版惨不忍睹的老课件,它能把它改得像科技公司 Keynote 的水准。但目前 Claw 仍在公测,单次限时 1 小时,超时数据销毁。

开发者工具链。MiMo Code 是一个基于 OpenCode 改造的终端 AI 编程 Agent,MIT 协议开源,专攻长程自动化编程任务。模型 API 接口兼容 OpenAI 格式,可以接 Claude Code、Cursor、Cline 等主流工具。SDK 方面提供了 Python 封装,也支持通过 OpenRouter 调用。对已经有编程习惯的人来说,接入成本很低。

功能模块 覆盖能力 成熟度 一句话点评
对话推理 文本对话+深度搜索+联网 稳定 基础体验在线,搜索偶有翻车
多模态 图片/视频/音频识别 公测中 V2.5 标准版能用,Pro 版暂缺
MiMo Claw 多步 Agent 执行 公测中 很有想象力,体验还粗糙
MiMo Code 终端编程 Agent 可用 开源 MIT,长程任务能打
语音 TTS/ASR 语音合成+识别+克隆 部分限免 克隆效果好,方言覆盖多
文档处理 PPT/Word/Excel/PDF 可用 靠 WPS 生态打通,排版美化的亮点突出

从注册到出活

参数再漂亮,注册流程要是劝退那也白搭。直接走一遍真实操作路径。

打开官网 mimo.xiaomi.com,页面设计挺干净,没有一上来就甩十几条功能介绍。右上角点登录,支持小米账号扫码和手机号注册,一分钟搞定。进主页后中央就是对话框,左边可以切换模型:MiMo-V2.5-Pro(推理旗舰)和 MiMo-V2.5(多模态标准版),不需要安装任何东西。

第一次试,我让 V2.5 Pro 写一个解一元二次方程的网页计算器。大概 15 秒,HTML 代码就吐出来了,复制进浏览器直接能用,输入三个系数就算出 x 的值。速度比想象中快,代码质量中等偏上,没语法错误,但 UI 是纯文字界面,长得不太好看。加了一句”美化一下界面,加上渐变色和圆角”,第二轮生成的比第一版好了不少。

小米 MiMo Studio 测评:雷总家的"龙虾"到底香不香?

换个方向试多模态能力。随手拍了张书桌上的文具,画面乱、光线一般,MiMo V2.5 把钢笔、便签、充电器全列出来了,连便签上写着”下午三点开会”都识别对了。这个准确率在开放场景下算很不错的。

槽点也有。Claw 的使用有 1 小时限制,对复杂任务很不友好,你的分析做到一半突然提示时间到,心态多少会崩。另一个是联网搜索,问”盘点小米 2025 年发布过的手机”,它把 2024 年发布的机型也列了进来,信源是一篇 AI 生成的错误博客。这种低级翻车对搜索质量的影响比生成速度慢更致命。

几个隐藏技巧

基础操作用会了,但这些进阶玩法才真正拉开效率差距。

很多人不知道还有这些玩法:

  • 指定模型精度的 Prompt 技巧:在问题前加一句”逐步推理,先列已知条件再求解”,可以让 V2.5 Pro 的输出准确率提升约 3-5 个百分点。实测数学题和逻辑题场景尤其明显,因为 MoE 架构在明确推理框架下路由更精准。
  • Claw 组合任务链:单次 Claw 会话可以做串行任务,用”先 A,完成后自动执行 B,最终汇总生成 C”的格式下指令。比独立分三次提问省掉约 40% 的手动操作,适合日报生成、数据流水线等固定流程。
  • 多模态+文本联动:上传产品图后,在同一对话里直接要 MiMo 写产品描述文案。不用切对话也不用重新描述图片,一次问答就能完成”识别+生成”,比分开来用省掉 60% 的链路时间。
  • API 夜间优惠时段:Token Plan 在凌晨 0:00-8:00 的消耗系数是日常的 0.8 倍。如果你的批量生成任务不赶时效(比如隔夜生成测试报告),设置在这个时段跑,同额度下能多产出约 25% 的 Token。
  • 文档处理三合一:MiMo Studio 接入了金山 WPS 生态,处理 Word、Excel、PPT、PDF 不需要单独下载文档。在 Claw 里直接给链接或上传文件,AI 可以提取内容、翻译、分析、美化排版,整个过程都在网页端完成。26 页的英文 PDF 导入后约 3 分钟出分析摘要,比人工操作快了至少 5 倍。

和竞品掰手腕

光说它好没用,同赛道的对手比比才知道差距在哪。

国产大模型赛道 2026 年 4 月堪称疯狂,一周之内 DeepSeek V4、Kimi K2.6、MiMo V2.5、GLM-5.1 连环发布。把四家放在一起看看谁更能打:

对比维度 MiMo V2.5 Pro DeepSeek V4 Kimi K2.6 通义千问 Qwen3
核心定位 Agent+推理旗舰 代码+数学推理 长文本+Agent 通用+多模态全能
上下文窗口 1M Token 128K Token 1M Token 256K Token
多模态支持 V2.5标准版支持 仅文本 文本+文件 全模态(VL+Audio)
API 入门价(输出) ¥6/百万token ¥4/百万token ¥2/百万token ¥2/百万token
Agent 能力 Claw 内置 依赖外部框架 内置分流 Function Call
开源协议 MIT MIT 部分开源 Apache 2.0

最明显的差异在三个点上。生态整合,MiMo 是唯一一个深度绑定了办公套件(金山 WPS)和终端设备生态(小米手机/汽车/家居)的模型。多模态路线,V2.5 标准版的多模态做的是真理解而不是简单的”看图说话”,但 Pro 版暂时不带这个能力让人有点遗憾。价格定位,API 按量计费在旗舰模型档位里不算便宜,但 Token Plan 的 39 元起步价对编程场景的性价比很高,夜间 8 折优惠也是个实在的省钱手段。

真实用户反馈

参数上说赢了,来看看真实世界里用的人到底怎么评价。

社交媒体上关于 MiMo Studio 的讨论挺两极的。喜欢的人集中在这几个点:一是推理能力扎实,遇到不确定的问题会主动说不知道,而不是瞎编,这点在大模型幻觉严重的当下很难得。二是 PPT 美化功能,原版旧课件扔进去出来就变了样,”至少字体颜色正常了,看着舒服多了”是不少用户的真实感受。三是开源 MIT 协议给开发者社区吃了定心丸,不用担心授权问题。

吐槽的声音也很具体。联网搜索的准确度是最被诟病的,容易引用低质量来源导致翻车,36 氪实测盘点小米机型时发现它被 AI 生成的错误博客误导。Claw 的 1 小时限制对长任务极不友好,超时后所有数据清零,相当于白做。还有开发者提到,API 文档目前还不够详尽,部分场景需要自己摸索调用方式。

第三方评分平台上,XSCT Arena 给 MiMo V2.5 打了 84.9 分(第 23 名),数学、一致性、阅读理解三项在困难梯度下稳定在 89-92 分区间,但幻觉抵抗能力得分偏低。横向比较,同榜单 DeepSeek V4 排进前 5,综合实力还是逊了一筹。

小米 MiMo Studio 测评:雷总家的"龙虾"到底香不香?

多维评分

口碑有赞有踩,从专业维度给个量化分数才更有参考价值。

维度 评分 一句话解读
功能完整性 ⭐⭐⭐⭐☆ 文本+多模态+Agent 覆盖广,Claw 待完善
易用性 ⭐⭐⭐⭐⭐ 网页即开即用,零安装门槛
性价比 ⭐⭐⭐⭐☆ 免费额度够试,Token Plan 39 元档很能打
创新性 ⭐⭐⭐⭐☆ Claw Agent 和生态整合思路有差异点
稳定性 ⭐⭐⭐☆☆ 搜索偶翻车,Claw 有 1h 限制
推荐度 ⭐⭐⭐⭐☆ 开发者和办公党可冲,重度 Agent 用户再等等

综合评分:7.5 / 10

优点和槽点

优势

  • 模型全家桶一站式覆盖:从对话到 Agent 到语音,一个入口解决多种需求,不用注册多个平台
  • 推理风格务实不浮夸:遇到不确定会主动说明,逻辑题拆解清晰,比堆参数刷榜的路线更实用
  • 办公生态整合有真东西:接入金山 WPS 后,文档处理流水线打通,PPT 美化是实测最让人意外的亮点
  • 开源 MIT 对开发者友好:模型可本地部署也可商用,API 兼容 OpenAI 格式,接入成本极低

不足

  • 联网搜索质量拖后腿:信源质量不可控,容易引用错误信息,是当前最大短板
  • Claw 公测限制太紧:单次 1 小时限时且数据不保留,长任务场景几乎不可用
  • 多模态 Pro 版缺失:旗舰推理模型不含多模态能力,和标准版的能力断层造成选择纠结

对号入座指南

好坏都摆在这了,来对号入座,你是不是它的目标用户。

  • 小米生态深度用户:手机、汽车、家居都在小米体系里的,MiMo 的跨设备协同潜力很大。小爱同学未来的底层推理可能会用 MiMo 支撑,”一句话控制全家”的场景值得期待。
  • AI 开发者/编程党:Token Plan 的编程场景定价在同级模型中有竞争力,MIT 开源让二次开发零顾虑。Claude Code 和 Cursor 的无缝接入对已有的编程工作流几乎零适配成本。
  • 办公文档重度用户:WPS 生态集成是差异化优势。PPT 美化、PDF 分析、财报解读这类场景,效率比纯手工作业高一大截。
  • 学生和研究人员:深度推理模式对数学题、论文分析、实验数据处理有独特价值,逻辑链拆解的方式比直接出答案更适合学习场景。
  • 不太适合的人群:如果你核心需求是联网搜索找准确信息,MiMo 目前的搜索质量可能让你失望。Gemini 或 Kimi 在信息检索维度目前更可靠。重度 Agent 用户也需要等 Claw 公测结束,现阶段 1 小时限制让复杂工作流根本无法跑通。

定价方案

人群对上了,最现实的问题来了,这刀利不利。

截至 2026 年 6 月官网显示,MiMo 的收费分成两条路径:面向普通用户的网页端免费对话,以及面向开发者的 API 和 Token Plan 订阅。

方案 价格 核心权益 适合场景
网页免费版 ¥0 V2.5 系列模型对话、Claw 公测体验 日常使用、尝鲜
Token Plan Lite ¥39/月 4.1B Credits,约 200 轮任务 个人开发者初试编程
Token Plan Standard ¥99/月 11B Credits,约 1600 轮任务 日常高频编程
Token Plan Pro ¥329/月 38B Credits,约 5600 轮任务 专业开发者重度使用
Token Plan Max ¥659/月 82B Credits,约 12800 轮任务 团队或高强度工作流
API 按量计费 ¥1-6/百万token 用多少付多少,无额度封顶 产品集成、批量调用

Token Plan 的定位是给编程场景用的,不能在自动化脚本或后端产品里当 API 使。API 按量计费的话,MiMo V2.5 标准版的输出价格是 ¥2/百万 token,对标同级别的 Kimi K2.6 和 Qwen3 还算持平。Pro 版的 ¥6/百万 token 在旗舰模型里偏贵,但如果你用得勤,Pro 和 Max 套餐的单价折算下来其实比按量计费省 30% 左右。另外夜间 8 折是个实用的省钱策略,凌晨跑批量任务每月能挤出不少额度。

网页端免费额度对轻度用户完全够用,深度对话和基础 Agent 日常能跑,不收钱。这个策略很小米,先让你用爽了,再靠开发者生态收钱。

常见问题

细节说了一大堆,下面这几个问题你应该还想知道答案。

Q1:MiMo Studio 和 ChatGPT 比怎么样?

A1:各有长短。 MiMo 的推理和 Agent 端到端设计对办公和编程场景更友好,ChatGPT 在通用对话和多模态一致性上目前仍是标杆。选哪个主要看你用在哪。


Q2:免费版有什么限制?

A2:网页端对话目前基本免费。 MiMo Claw 公测阶段免费使用但有单次 1 小时限制。API 和 Token Plan 是付费的,免费用户不享有 API 调用额度。


Q3:MiMo 支持本地部署吗?

A3:支持,旗舰模型已开源 MIT 协议。 可以在自有 GPU 上部署推理,推荐配置 RTX 4090 及以上。V2.5 全系列均支持本地部署,量化版本对硬件更友好。


Q4:MiMo Claw 和普通对话有什么区别?

A4:Claw 是 AI Agent,对话是纯问答。 Claw 能执行多步任务(搜索、分析、生成)并产出最终文件,普通对话每次只回答一个问题。Claw 目前仍处在公测阶段。


Q5:用 MiMo 生成的内容版权归谁?

A5:归用户所有,MIT 开源协议不限制商用。 你通过 MiMo 生成的内容和代码可以自由使用和商用。但联网搜索引用的外部内容需遵守原始版权。


Q6:MiMo Studio 需要科学上网吗?

A6:不需要。 国内网络直接访问 mimo.xiaomi.com,API 服务也在国内部署,延迟低。海外用户同样可以直接访问,服务全球化部署。


Q7:Token Plan 的 Credits 用完了怎么办?

A7:当月额度耗尽后服务停止。 不会额外扣费。你可以升级到更高档套餐继续用,或切换到 API 按量计费模式。套餐支持补差价升级,不支持降级。


Q8:V2 系列模型还能用多久?

A8:V2 系列将于 2026 年 6 月 30 日全面下线。 目前已被自动转发至 V2.5 系列并按新定价计费。建议尽早切换到 V2.5 模型以获得更好性能和价格。


Q9:MiMo 的语音合成 TTS 怎么用?

A9:当前限时免费。 通过 API 调用 TTS 模型,支持情感控制、方言、声音克隆和定制新音色。Token Plan 套餐中调用 TTS 不消耗 Credits。


Q10:适合用它替 Claude 做编程吗?

A10:可以替代大部分场景,但非全部。 常规代码生成和调试效果不错,MIT 开源无授权风险。复杂架构设计和深度推理任务,Claude 在部分场景仍更稳定。


所以到底值不值得

MiMo Studio 是一个在正确方向上半途作业的产品。模型底子不错,推理务实、多模态能打、生态整合思路清晰,办公场景有几个功能是真的爽。但搜索质量、Agent 稳定性这些硬伤又让你用着时不时心头一紧。

适合现在入手的:小米生态用户、开发者编程场景、办公文档处理需求。这些场景下,MiMo 的表现大概率让你满意。应该再等等的:重度 Agent 用户、对搜索准确性要求高的人。等 Claw 公测结束、搜索信号源治理上了之后再入也不迟。可以先网页版免费用着,真觉得顺手再上 Token Plan。

AI工具

Decitron 测评:推演世界的 AI,离好用还有多远

2026-6-18 8:15:52

AI工具

豆包2.1 Pro 实测:国产大模型杀进"生产级",编程和Agent这次是真的能打了

2026-6-24 14:06:00

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧