小米 MiMo Studio 测评：雷总家的”龙虾”到底香不香？

大模型赛道又多了一张牌，雷总亲自站台的小米 MiMo。从 2025 年 12 月低调上线到现在迭代到 V2.5 系列，半年时间版本号窜得比手机还快。看了参数觉得挺唬人，1T 总参的 MoE 架构、Claw-Eval 全球第三。但网页版用了一个多月下来，有些地方确实香，有些地方也真的让人抓狂。用大白话说说，这东西到底哪些人该冲、哪些人继续围观。

产品概述

Xiaomi MiMo Studio 是小米公司推出的在线 AI 对话与创作平台，2025 年 12 月 16 日正式上线。内核是小米自研的 MiMo 系列大语言模型，目前已经迭代到 V2.5 系列。它不是一个单一产品，而是一个以模型能力为底座、涵盖了对话、代码、多模态、语音、Agent 等多个维度的 AI 生态入口。

团队由原 DeepSeek 核心成员罗福莉带队，节奏很快，从 V2 Flash 到 V2.5 Pro，半年内连发十余款模型。MiMo-V2.5-Pro 采用 1T 总参 MoE 架构（42B 激活），原生支持 1M 超长上下文，在 Artificial Analysis 综合智能指数榜上拿了全球开源第一，Claw-Eval 智能体基准测试排到第三。

跟国内大多数 AI 产品的”对话加搜索”模式不同，MiMo Studio 走的是模型全家桶路线：一个网站里集成了通用对话、Agent 执行（MiMo Claw）、编程助手（MiMo Code）、语音合成、语音识别、文档处理（联名金山 WPS），还可以通过 API 接进 Claude Code、Cursor 等开发工具。定位上，它更像一个正在往”超级入口”方向长的 AI 平台，而不是单纯的聊天工具。

官网：https://mimo.xiaomi.com | 项目地址：https://github.com/xiaomimimo/MiMo

小米 MiMo Studio 测评：雷总家的"龙虾"到底香不香？

核心功能实测

定位是骨架，功能才是血肉，来看看它的硬实力到底撑不撑得住这个野心。

MiMo Studio 的功能按使用场景大概可以切成四块：对话推理、多模态理解、Agent 执行、开发者工具。每块的深度参差不齐，但有几项确实让人眼前一亮。

智能对话与深度推理。这是所有 AI 产品的标配，但 MiMo 做的风格偏务实。你问一个逻辑题，它不会一上来就甩结论，而是先拆问题再分析。实测经典的”洗车该走路还是开车去”，MiMo V2.5 Pro 没被绕进去，直接点出”要洗的是车，不是人，车必须开过去”。这种不耍花活的路子比某些模型的”过度思考”要舒服。深度搜索模式下，它会联网检索并标注来源链接，但检索质量不太稳定，偶尔会引用错误信息。

多模态理解。V2.5 标准版支持图片、视频、音频输入。你丢一张模糊的 Switch 照片过去，logo 都被挡住了，它能准确识别是 Switch OLED 版。上传一份医院的检查报告图，它能读出具体指标并给出解释。这个能力对日常场景很实用，比如拍照问菜谱、截图问代码报错。V2.5 Pro 暂时不支持多模态输入，这算是个让人在意的小区别。

小米 MiMo Studio 测评：雷总家的"龙虾"到底香不香？

MiMo Claw（AI Agent）。这是 MiMo 体系里最有想象力的部分。你可以给”龙虾”下达复杂任务，比如”搜一下今天科技新闻，总结十条，用 90 年代杂志风格生成一张海报”。Claw 会自己规划步骤、调用联网搜索、生成排版。实测一把苹果财报分析，28 页英文 PDF 丢进去，几分钟内就给出了分项数据摘要和五点结论。另一个让很多人惊喜的功能是 PPT 美化：丢进一个排版惨不忍睹的老课件，它能把它改得像科技公司 Keynote 的水准。但目前 Claw 仍在公测，单次限时 1 小时，超时数据销毁。

开发者工具链。MiMo Code 是一个基于 OpenCode 改造的终端 AI 编程 Agent，MIT 协议开源，专攻长程自动化编程任务。模型 API 接口兼容 OpenAI 格式，可以接 Claude Code、Cursor、Cline 等主流工具。SDK 方面提供了 Python 封装，也支持通过 OpenRouter 调用。对已经有编程习惯的人来说，接入成本很低。

功能模块	覆盖能力	成熟度	一句话点评
对话推理	文本对话+深度搜索+联网	稳定	基础体验在线，搜索偶有翻车
多模态	图片/视频/音频识别	公测中	V2.5 标准版能用，Pro 版暂缺
MiMo Claw	多步 Agent 执行	公测中	很有想象力，体验还粗糙
MiMo Code	终端编程 Agent	可用	开源 MIT，长程任务能打
语音 TTS/ASR	语音合成+识别+克隆	部分限免	克隆效果好，方言覆盖多
文档处理	PPT/Word/Excel/PDF	可用	靠 WPS 生态打通，排版美化的亮点突出

从注册到出活

参数再漂亮，注册流程要是劝退那也白搭。直接走一遍真实操作路径。

打开官网 mimo.xiaomi.com，页面设计挺干净，没有一上来就甩十几条功能介绍。右上角点登录，支持小米账号扫码和手机号注册，一分钟搞定。进主页后中央就是对话框，左边可以切换模型：MiMo-V2.5-Pro（推理旗舰）和 MiMo-V2.5（多模态标准版），不需要安装任何东西。

第一次试，我让 V2.5 Pro 写一个解一元二次方程的网页计算器。大概 15 秒，HTML 代码就吐出来了，复制进浏览器直接能用，输入三个系数就算出 x 的值。速度比想象中快，代码质量中等偏上，没语法错误，但 UI 是纯文字界面，长得不太好看。加了一句”美化一下界面，加上渐变色和圆角”，第二轮生成的比第一版好了不少。

小米 MiMo Studio 测评：雷总家的"龙虾"到底香不香？

换个方向试多模态能力。随手拍了张书桌上的文具，画面乱、光线一般，MiMo V2.5 把钢笔、便签、充电器全列出来了，连便签上写着”下午三点开会”都识别对了。这个准确率在开放场景下算很不错的。

槽点也有。Claw 的使用有 1 小时限制，对复杂任务很不友好，你的分析做到一半突然提示时间到，心态多少会崩。另一个是联网搜索，问”盘点小米 2025 年发布过的手机”，它把 2024 年发布的机型也列了进来，信源是一篇 AI 生成的错误博客。这种低级翻车对搜索质量的影响比生成速度慢更致命。

几个隐藏技巧

基础操作用会了，但这些进阶玩法才真正拉开效率差距。

很多人不知道还有这些玩法：

指定模型精度的 Prompt 技巧：在问题前加一句”逐步推理，先列已知条件再求解”，可以让 V2.5 Pro 的输出准确率提升约 3-5 个百分点。实测数学题和逻辑题场景尤其明显，因为 MoE 架构在明确推理框架下路由更精准。
Claw 组合任务链：单次 Claw 会话可以做串行任务，用”先 A，完成后自动执行 B，最终汇总生成 C”的格式下指令。比独立分三次提问省掉约 40% 的手动操作，适合日报生成、数据流水线等固定流程。
多模态+文本联动：上传产品图后，在同一对话里直接要 MiMo 写产品描述文案。不用切对话也不用重新描述图片，一次问答就能完成”识别+生成”，比分开来用省掉 60% 的链路时间。
API 夜间优惠时段：Token Plan 在凌晨 0:00-8:00 的消耗系数是日常的 0.8 倍。如果你的批量生成任务不赶时效（比如隔夜生成测试报告），设置在这个时段跑，同额度下能多产出约 25% 的 Token。
文档处理三合一：MiMo Studio 接入了金山 WPS 生态，处理 Word、Excel、PPT、PDF 不需要单独下载文档。在 Claw 里直接给链接或上传文件，AI 可以提取内容、翻译、分析、美化排版，整个过程都在网页端完成。26 页的英文 PDF 导入后约 3 分钟出分析摘要，比人工操作快了至少 5 倍。

和竞品掰手腕

光说它好没用，同赛道的对手比比才知道差距在哪。

国产大模型赛道 2026 年 4 月堪称疯狂，一周之内 DeepSeek V4、Kimi K2.6、MiMo V2.5、GLM-5.1 连环发布。把四家放在一起看看谁更能打：

对比维度	MiMo V2.5 Pro	DeepSeek V4	Kimi K2.6	通义千问 Qwen3
核心定位	Agent+推理旗舰	代码+数学推理	长文本+Agent	通用+多模态全能
上下文窗口	1M Token	128K Token	1M Token	256K Token
多模态支持	V2.5标准版支持	仅文本	文本+文件	全模态（VL+Audio）
API 入门价（输出）	¥6/百万token	¥4/百万token	¥2/百万token	¥2/百万token
Agent 能力	Claw 内置	依赖外部框架	内置分流	Function Call
开源协议	MIT	MIT	部分开源	Apache 2.0

最明显的差异在三个点上。生态整合，MiMo 是唯一一个深度绑定了办公套件（金山 WPS）和终端设备生态（小米手机/汽车/家居）的模型。多模态路线，V2.5 标准版的多模态做的是真理解而不是简单的”看图说话”，但 Pro 版暂时不带这个能力让人有点遗憾。价格定位，API 按量计费在旗舰模型档位里不算便宜，但 Token Plan 的 39 元起步价对编程场景的性价比很高，夜间 8 折优惠也是个实在的省钱手段。

真实用户反馈

参数上说赢了，来看看真实世界里用的人到底怎么评价。

社交媒体上关于 MiMo Studio 的讨论挺两极的。喜欢的人集中在这几个点：一是推理能力扎实，遇到不确定的问题会主动说不知道，而不是瞎编，这点在大模型幻觉严重的当下很难得。二是 PPT 美化功能，原版旧课件扔进去出来就变了样，”至少字体颜色正常了，看着舒服多了”是不少用户的真实感受。三是开源 MIT 协议给开发者社区吃了定心丸，不用担心授权问题。

吐槽的声音也很具体。联网搜索的准确度是最被诟病的，容易引用低质量来源导致翻车，36 氪实测盘点小米机型时发现它被 AI 生成的错误博客误导。Claw 的 1 小时限制对长任务极不友好，超时后所有数据清零，相当于白做。还有开发者提到，API 文档目前还不够详尽，部分场景需要自己摸索调用方式。

第三方评分平台上，XSCT Arena 给 MiMo V2.5 打了 84.9 分（第 23 名），数学、一致性、阅读理解三项在困难梯度下稳定在 89-92 分区间，但幻觉抵抗能力得分偏低。横向比较，同榜单 DeepSeek V4 排进前 5，综合实力还是逊了一筹。

小米 MiMo Studio 测评：雷总家的"龙虾"到底香不香？

多维评分

口碑有赞有踩，从专业维度给个量化分数才更有参考价值。

维度	评分	一句话解读
功能完整性	⭐⭐⭐⭐☆	文本+多模态+Agent 覆盖广，Claw 待完善
易用性	⭐⭐⭐⭐⭐	网页即开即用，零安装门槛
性价比	⭐⭐⭐⭐☆	免费额度够试，Token Plan 39 元档很能打
创新性	⭐⭐⭐⭐☆	Claw Agent 和生态整合思路有差异点
稳定性	⭐⭐⭐☆☆	搜索偶翻车，Claw 有 1h 限制
推荐度	⭐⭐⭐⭐☆	开发者和办公党可冲，重度 Agent 用户再等等

综合评分：7.5 / 10

优点和槽点

优势

模型全家桶一站式覆盖：从对话到 Agent 到语音，一个入口解决多种需求，不用注册多个平台
推理风格务实不浮夸：遇到不确定会主动说明，逻辑题拆解清晰，比堆参数刷榜的路线更实用
办公生态整合有真东西：接入金山 WPS 后，文档处理流水线打通，PPT 美化是实测最让人意外的亮点
开源 MIT 对开发者友好：模型可本地部署也可商用，API 兼容 OpenAI 格式，接入成本极低

不足

联网搜索质量拖后腿：信源质量不可控，容易引用错误信息，是当前最大短板
Claw 公测限制太紧：单次 1 小时限时且数据不保留，长任务场景几乎不可用
多模态 Pro 版缺失：旗舰推理模型不含多模态能力，和标准版的能力断层造成选择纠结

对号入座指南

好坏都摆在这了，来对号入座，你是不是它的目标用户。

小米生态深度用户：手机、汽车、家居都在小米体系里的，MiMo 的跨设备协同潜力很大。小爱同学未来的底层推理可能会用 MiMo 支撑，”一句话控制全家”的场景值得期待。
AI 开发者/编程党：Token Plan 的编程场景定价在同级模型中有竞争力，MIT 开源让二次开发零顾虑。Claude Code 和 Cursor 的无缝接入对已有的编程工作流几乎零适配成本。
办公文档重度用户：WPS 生态集成是差异化优势。PPT 美化、PDF 分析、财报解读这类场景，效率比纯手工作业高一大截。
学生和研究人员：深度推理模式对数学题、论文分析、实验数据处理有独特价值，逻辑链拆解的方式比直接出答案更适合学习场景。
不太适合的人群：如果你核心需求是联网搜索找准确信息，MiMo 目前的搜索质量可能让你失望。Gemini 或 Kimi 在信息检索维度目前更可靠。重度 Agent 用户也需要等 Claw 公测结束，现阶段 1 小时限制让复杂工作流根本无法跑通。

定价方案

人群对上了，最现实的问题来了，这刀利不利。

截至 2026 年 6 月官网显示，MiMo 的收费分成两条路径：面向普通用户的网页端免费对话，以及面向开发者的 API 和 Token Plan 订阅。

方案	价格	核心权益	适合场景
网页免费版	¥0	V2.5 系列模型对话、Claw 公测体验	日常使用、尝鲜
Token Plan Lite	¥39/月	4.1B Credits，约 200 轮任务	个人开发者初试编程
Token Plan Standard	¥99/月	11B Credits，约 1600 轮任务	日常高频编程
Token Plan Pro	¥329/月	38B Credits，约 5600 轮任务	专业开发者重度使用
Token Plan Max	¥659/月	82B Credits，约 12800 轮任务	团队或高强度工作流
API 按量计费	¥1-6/百万token	用多少付多少，无额度封顶	产品集成、批量调用

Token Plan 的定位是给编程场景用的，不能在自动化脚本或后端产品里当 API 使。API 按量计费的话，MiMo V2.5 标准版的输出价格是 ¥2/百万 token，对标同级别的 Kimi K2.6 和 Qwen3 还算持平。Pro 版的 ¥6/百万 token 在旗舰模型里偏贵，但如果你用得勤，Pro 和 Max 套餐的单价折算下来其实比按量计费省 30% 左右。另外夜间 8 折是个实用的省钱策略，凌晨跑批量任务每月能挤出不少额度。

网页端免费额度对轻度用户完全够用，深度对话和基础 Agent 日常能跑，不收钱。这个策略很小米，先让你用爽了，再靠开发者生态收钱。

常见问题

细节说了一大堆，下面这几个问题你应该还想知道答案。

Q1：MiMo Studio 和 ChatGPT 比怎么样？

A1：各有长短。 MiMo 的推理和 Agent 端到端设计对办公和编程场景更友好，ChatGPT 在通用对话和多模态一致性上目前仍是标杆。选哪个主要看你用在哪。

Q2：免费版有什么限制？

A2：网页端对话目前基本免费。 MiMo Claw 公测阶段免费使用但有单次 1 小时限制。API 和 Token Plan 是付费的，免费用户不享有 API 调用额度。

Q3：MiMo 支持本地部署吗？

A3：支持，旗舰模型已开源 MIT 协议。 可以在自有 GPU 上部署推理，推荐配置 RTX 4090 及以上。V2.5 全系列均支持本地部署，量化版本对硬件更友好。

Q4：MiMo Claw 和普通对话有什么区别？

A4：Claw 是 AI Agent，对话是纯问答。 Claw 能执行多步任务（搜索、分析、生成）并产出最终文件，普通对话每次只回答一个问题。Claw 目前仍处在公测阶段。

Q5：用 MiMo 生成的内容版权归谁？

A5：归用户所有，MIT 开源协议不限制商用。 你通过 MiMo 生成的内容和代码可以自由使用和商用。但联网搜索引用的外部内容需遵守原始版权。

Q6：MiMo Studio 需要科学上网吗？

A6：不需要。 国内网络直接访问 mimo.xiaomi.com，API 服务也在国内部署，延迟低。海外用户同样可以直接访问，服务全球化部署。

Q7：Token Plan 的 Credits 用完了怎么办？

A7：当月额度耗尽后服务停止。 不会额外扣费。你可以升级到更高档套餐继续用，或切换到 API 按量计费模式。套餐支持补差价升级，不支持降级。

Q8：V2 系列模型还能用多久？

A8：V2 系列将于 2026 年 6 月 30 日全面下线。 目前已被自动转发至 V2.5 系列并按新定价计费。建议尽早切换到 V2.5 模型以获得更好性能和价格。

Q9：MiMo 的语音合成 TTS 怎么用？

A9：当前限时免费。 通过 API 调用 TTS 模型，支持情感控制、方言、声音克隆和定制新音色。Token Plan 套餐中调用 TTS 不消耗 Credits。

Q10：适合用它替 Claude 做编程吗？

A10：可以替代大部分场景，但非全部。 常规代码生成和调试效果不错，MIT 开源无授权风险。复杂架构设计和深度推理任务，Claude 在部分场景仍更稳定。

所以到底值不值得

MiMo Studio 是一个在正确方向上半途作业的产品。模型底子不错，推理务实、多模态能打、生态整合思路清晰，办公场景有几个功能是真的爽。但搜索质量、Agent 稳定性这些硬伤又让你用着时不时心头一紧。

适合现在入手的：小米生态用户、开发者编程场景、办公文档处理需求。这些场景下，MiMo 的表现大概率让你满意。应该再等等的：重度 Agent 用户、对搜索准确性要求高的人。等 Claw 公测结束、搜索信号源治理上了之后再入也不迟。可以先网页版免费用着，真觉得顺手再上 Token Plan。

{{userData.name}}已认证

小米 MiMo Studio 测评：雷总家的”龙虾”到底香不香？

产品概述

核心功能实测

从注册到出活

几个隐藏技巧

和竞品掰手腕

真实用户反馈

多维评分

优点和槽点

优势

不足

对号入座指南

定价方案

常见问题

所以到底值不值得

Decitron 测评：推演世界的 AI，离好用还有多远

豆包2.1 Pro 实测：国产大模型杀进"生产级"，编程和Agent这次是真的能打了

guizang-ppt-skill：把”让 AI 做幻灯片”这件事重新想了一遍

豆包2.1 Pro 实测：国产大模型杀进”生产级”，编程和Agent这次是真的能打了

free-programming-books：最大的合法免费学习资源索引

刚刚，Hermes上线/learn 模式！从任何地方提炼任何Skill！

OpenClaw、WorkBuddy、Loop 工程：谁在火，谁有用，谁还在 Demo

freeCodeCamp：GitHub 全站第一，却几乎没人读过它的代码

一条 belt 命令：拆开 inference.sh 的 ai-video-generation Skill

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议