Kimi Work 评测:能让300个Agent同时干活,到底行不行?

还在手动查数据、写报告、做PPT?Kimi Work说它能让300个AI同时帮你干活。6月3日,月之暗面扔出了这个面向知识工作者的本地Agent,用自然语言就能在电脑上自动执行任务,92%代码是AI自己写的,一周就搞出了Beta版。但刚出炉的东西,是真本事还是花架子?

产品概述

Kimi Work 是月之暗面(Moonshot AI)推出的通用型本地 Agent,6 月 3 日随 Kimi 最新测试版 Mac 和 Windows 客户端开启公测。内核是 Kimi Code,本质上是一个驻扎在你电脑里的 AI 执行器。

和在线版 Kimi 完全不同。在线版是你问它答,像聊天;Kimi Work 是你告诉它要什么,它自己在电脑上动手干。读本地文件、打开浏览器查数据、生成报告、导出 PPT,全程不用你碰终端和命令行。简单说,AI 从”嘴替”变成了”手替”。

官网:https://www.kimi.com

Kimi Work 评测:能让300个Agent同时干活,到底行不行?

月之暗面给它的定位很清晰:知识工作者的通用型本地 Agent。不是面向某个垂直场景,而是能覆盖办公、研究、创作、资料整理等多种知识工作。这个定位在国内大模型赛道里算是独一份,大部分同类产品还在卷聊天体验,它直接跳到了”帮你干活”的阶段。

到底强在哪

功能列表写得漂亮没用,挑几个真正有区分度的来看看。

功能 一句话说明 差异化程度
自然语言驱动 描述目标,自动拆解任务并执行,零命令行操作 极高
Agent 集群 最多 300 个子 Agent 自主协作,并行处理复杂任务 极高
Skill 系统 安装使用建站、PPT、数据分析等专业技能
定时任务 设置定时执行的自动化工作流
Kimi WebBridge 通过内置方案调用本地浏览器,实现网页操作自动化
专业数据库 接入金融、科研、法律等垂直领域数据库

Agent 集群是目前最大的亮点。它不是简单的一对一问答,而是根据任务复杂度动态创建子 Agent 团队,最多 300 个并行协作。比如你让 Kimi Work 做一份深度行业研报,它可能同时派出几个 Agent 分别查数据、读财报、整理新闻、生成图表,最后汇总成文档。

Skill 系统这块也值得多说两句。Kimi Work 继承了在线版 Kimi 的建站和 PPT 制作能力,还内置了金融、科研、法律等专业数据库。你不需要自己搭建环境或写代码,自然语言描述需求,它自动调用对应 Skill 干活。

更狠的是开发效率。Kimi Work 自身由 Kimi Code 深度参与编写,工程师团队在一周内完成了 Beta 版 Mac 和 Windows 客户端,累计产出超过 5 万行有效代码,其中 92% 由 AI 自主生成。用自己写的工具写自己,这个自举循环挺有意思的。

不过注意,目前 Skill 生态还在初期。官方提到的主要是建站、PPT 和数据库查询这几类,跟成熟生态(比如 VS Code 的插件市场)比还差得远。功能框架搭好了,就看社区能不能跟上。

上手流程

功能描述听起来很唬人,那实际用起来顺不顺手?

安装就是下个客户端,用 Kimi 账号登录,不额外注册。首次进入后会看到一个类似对话框的主界面,底部输入框可以描述任务,也支持拖拽文件进去。

我试着让它读一份 PDF 财报并提取关键数据。任务提交后,它先自动拆解步骤:解析 PDF、定位财务报表章节、提取关键指标、整理成表格。整个过程大概两三分钟,中间能看到子 Agent 的状态切换,哪个在读文件、哪个在整理数据。

出来结果后第一感受是:比预想的靠谱。它没有胡乱编造数字,提取的营收和利润数据跟原文对得上。但也有翻车时刻:让它查一家公司的近一年股价走势并生成图表,它有时候会卡在数据获取步骤,提示需要手动确认浏览器权限。这个问题在复杂任务里更容易出现。

工作流的自动化程度比想象中高。从读文件到出报告,中间需要人介入的地方不多,多数时候你只需要等结果。对比在线版 Kimi 的手动一步步操作,体验提升很明显,像从手动挡换到了自动挡。

话说回来,毕竟是 Beta 版,偶尔的任务卡顿和权限弹窗是意料之中的。公测期间稳定性还有提升空间,别指望它像成熟生产力工具那样丝滑。

这样用效率翻倍

基础玩法摸熟了,试试几个能拉开差距的高阶操作。

  • 批量处理文件:把多个同类文件(比如季度财报或竞品分析报告)一次性拖进去,描述统一的输出格式,它会自动逐个处理并汇总。实测十份 PDF 从读到生成对比表格大约五分钟,人力至少一小时起步。
  • 搭工作流链条:把定时任务和 Skill 串起来用。比如设定每天早上 9 点自动抓取指定网站的行业新闻,用数据分析 Skill 提取关键信息,再自动生成简报发到邮箱。一条自然语言描述就能搭好整条链。
  • 描述越具体,产出越精准:别只说”做个PPT”,试试”做个 10 页的融资演示 PPT,蓝色科技风,每页标注数据来源”。额外描述多花十几秒,但产出质量能差一个档次。这是 Agent 模式下的提示技巧,比手动操作更依赖语言精度。
  • 巧用专业数据库:做行研时直接在任务里指定数据源,比如”用金融数据库查 A 股消费板块近一个季度涨幅前五的公司,对比营收增速和市盈率”。这比手动开 Wind 或 Choice 查数据再复制粘贴快得多。

Kimi Work 评测:能让300个Agent同时干活,到底行不行?

不是说这些技巧有多难发现,而是很多人习惯性地把它当在线版 Kimi 用,你问一句它答一句。换到”派任务”心态,效率差别是数量级的。

竞品对比

赛道上能打的本地 Agent 产品一只手数得过来,放在一起看看各自斤两。

维度 Kimi Work Claude Code Cursor Devin
定位 通用知识工作 Agent CLI 编程 Agent AI 编程 IDE 自主软件工程师
交互方式 自然语言对话 终端命令行 IDE 内嵌 Web 界面
任务类型 办公/研究/创作/编程 纯编程 纯编程 纯编程
子 Agent 协作 最多 300 个 不支持集群 不支持集群 有限支持
中文支持 原生 一般 一般 一般
定价 公测免费 $20-200/月 $20/月起 $500/月起
本地文件操作 有限

注:定价数据截至 2026 年 6 月官网公开信息。

看得出来,Kimi Work 的最大差异化是”不局限于编程”。Claude Code、Cursor、Devin 都在卷代码生成,而 Kimi Work 直接切入了更大的知识工作赛道。做研报、写方案、整理资料这些事,代码 Agent 天然不擅长。

短板也很明显。Claude Code 和 Cursor 在编程场景下的专业深度远超 Kimi Work,Devin 在复杂软件工程任务上的自主性也更强。如果你是纯编程场景,Kimi Work 目前还替代不了专业编程 Agent。

用户反馈

产品昨天才发布,社区反馈还很少。但 B 站官宣视频下已经有不少讨论,几个有意思的声音整理如下。

正面评价集中在”终于有人做这个方向了”。多位用户表示等一个能本地干活的中文 Agent 等了很久,在线 AI 助手虽然方便但没法碰文件、没法自动执行,Kimi Work 补了这个缺。还有人对 300 个 Agent 集群协作的潜力充满期待。

吐槽也很直接。多数人关心什么时候出正式版和定价方案,公测期间免费固然好,但长期来看没有价格锚点很难做决策。另外有人提到 Linux 平台缺失是个遗憾,不少开发者和研究人员的主力机是 Linux。也有技术向的讨论认为,Skill 生态的丰富度会直接决定这个产品能走多远。

一个值得注意的信号:官方发布稿强调”一周写完 5 万行代码、92% AI 生成”这件事,在社区里引发了两种截然不同的反应。一部分人觉得这证明了产品能力,另一部分人担心这么快开发出来的东西会不会埋着坑。Beta 版嘛,争议是正常的。

综合打分

社区声音两极,来从专业维度给个量化分。

维度 评分 一句话解读
功能完整性 ⭐⭐⭐☆☆ 框架搭好了,Skill生态和场景覆盖还不够深
易用性 ⭐⭐⭐⭐☆ 自然语言驱动零门槛,但偶尔需要手动干预
性价比 ⭐⭐⭐⭐☆ 公测免费,正式定价未知暂按现有体验估
创新性 ⭐⭐⭐⭐⭐ 本地Agent+300子Agent集群,赛道内首创
稳定性 ⭐⭐⭐☆☆ Beta版偶有任务卡顿和权限问题,意料之中
推荐度 ⭐⭐⭐⭐☆ 办公和内容创作场景值得尝鲜,编程场景暂不建议
综合评分:7.5 / 10

优点和槽点

优势

  • 300 子 Agent 集群协作:类似产品中最大的并行处理规模,复杂任务拆解和协同能力突出
  • 自然语言零门槛:不需要终端或配置,描述目标即可自动执行,对非技术人员极其友好
  • 跨场景通用性:不被编程场景绑定,覆盖办公、研究、创作、资料整理等更广的知识工作
  • 自举开发效率:92% 代码由 AI 生成,后续产品迭代速度可能远超竞品

不足

  • Beta 版稳定性不够:复杂任务偶有卡顿,浏览器权限弹窗打断工作流
  • Skill 生态初期:可用的专业 Skill 有限,功能和场景覆盖深度有待社区和官方填充
  • 暂不支持 Linux:大量开发者和研究人员的主力平台暂时缺位
  • 定价方案未知:公测免费,但长期价格和会员权益完全不透明,影响购买决策

适合谁用

东西好不好是一回事,适不适合你是另一回事。

  • 办公室知识工作者:日常需要查数据、写报告、做PPT的职场人。Kimi Work 能把这些重复性任务打包成自动化流程,省掉大量机械操作时间。
  • 金融和咨询行业从业者:内置金融数据库,投研场景下能自动拉数据、做对比、出报告。配合定时任务,可以搭建每日市场简报的自动推送链条。
  • 科研人员和学生:文献整理、数据提取、论文格式检查这些事,批量丢给它处理比手动效率高一个数量级。法律数据库对法学研究者也有实用价值。
  • 内容创作者和自媒体:需要持续产出多平台内容的创作者,可以把选题调研、素材整理、初稿生成串成工作流,省去跳转多个工具的时间。
  • 不适合纯编程场景的开发者:如果你主要工作是写代码,Claude Code 或 Cursor 在编程深度上远超 Kimi Work。它不是编程工具,别拿它当 IDE 用。

多少钱

公测阶段完全免费,安装 Kimi 最新测试版客户端即可使用。截至 2026 年 6 月 3 日,官方尚未公布正式定价方案和会员体系。

阶段 费用 说明
Beta 公测 免费 全功能开放,需安装测试版客户端
正式版 待公布 预计公测结束后公布定价

目前没有任何付费墙或功能限制,可以先白嫖着。但考虑到产品定位和算力消耗,正式版大概率会有免费额度和付费层级。类比 Claude Code 的 $20-200/月区间,Kimi Work 的定价如果控制在百元以内会比较有竞争力。

对于观望中的用户,建议现在就可以上手试试。反正免费,看看它在你自己的工作流里能替代多少重复操作,等正式定价出来再决定要不要付费。

你可能还想问

看完以上内容,你可能还有几个纠结的点。

Q1:Kimi Work 和在线版 Kimi 到底什么关系?

A1:同一个公司,两个不同产品。 在线 Kimi 是对话式 AI 助手,你问它答。Kimi Work 是本地 Agent,你派任务它执行。区别在于:在线版不能动你的本地文件,Kimi Work 能直接操作文件、浏览器和系统工具。


Q2:Kimi Work 需要什么配置?

A2:目前支持 Mac 和 Windows,需安装最新测试版客户端。 Linux 暂不支持。官方未披露具体硬件要求,但从功能判断,内存建议 16GB 以上以保证多 Agent 并行时的流畅度。


Q3:数据安全吗?我的本地文件会不会被上传?

A3:官方定位为本地 Agent,任务在本地执行。 但涉及云端数据库查询和部分 Skill 调用时可能产生网络传输。具体安全策略和隐私协议建议查阅官方文档,公测期间可以保守使用,敏感文件先别丢进去。


Q4:Kimi Work 能替代程序员吗?

A4:能辅助,但不能替代。 它可以帮你写脚本、读代码、生成技术文档,但在复杂编程任务上远不如 Claude Code 或 Cursor 专业。把它当成编程助手而非主力 IDE 更合适。


Q5:300 个 Agent 真的能同时跑吗?

A5:取决于任务类型和本地算力。 理论容量是 300 个,但实际能同时流畅运行的子 Agent 数量受限于你的电脑配置。简单信息检索类任务可以同时跑很多,密集计算类任务则需要排队。


Q6:公测结束后会收费吗?

A6:极大概率会,但具体方案未公布。 参考 Kimi 在线版的付费模式和 Claude Code 的价格区间,正式版很可能提供免费额度加付费层级。截至 2026 年 6 月 3 日,官方没有释放任何定价信号。


Q7:和 WorkBuddy 比有什么区别?

A7:WorkBuddy 更偏编程和技能协作,Kimi Work 更偏通用知识工作。 两者都是本地 Agent,但 WorkBuddy 擅长代码生成和项目级协作,Kimi Work 胜在自然语言驱动的跨场景通用性和 300 Agent 集群。场景不同,不构成零和竞争。


Q8:Skill 系统怎么用?能自己开发吗?

A8:通过自然语言安装和使用,目前不支持自定义开发。 官方预置了建站、PPT、数据库查询等 Skill,用自然语言描述即可调用。自定义 Skill 开发能力在官方文档中未提及,可能是后续迭代方向。


Q9:定时任务能做多复杂的事?

A9:可以串联文件读取、数据查询、内容生成、格式输出等多步骤。 比如”每天早上 9 点读最新招股书,提取关键财务指标,存成 Excel”,一条自然语言描述就能设定。但任务链的容错和异常处理机制还不完善。


Q10:适合完全没有技术背景的人吗?

A10:非常合适。 不需要终端、命令行、环境配置,自然语言就是唯一的交互方式。比 Excel 宏、Zapier 等自动化工具的上手门槛低得多,知识工作者里最不懂技术的那群人反而是最大受益者。


最后

Kimi Work 方向对了。把 AI 从”陪聊”变成”帮手”,这一步是迟早要走的。月之暗面第一个在国内大模型赛道里踩出了这条路,赌注不小但逻辑自洽。

现在这个 Beta 版,框架扎实但血肉还不够。Skill 生态、稳定性、平台覆盖、定价透明度,每个都是要补齐的课。公测期间免费用,尝鲜成本为零,试试它在你自己的工作流里能干多少活,不吃亏。

如果你日常需要处理大量文档、数据、报表,给它一个机会。如果你是纯编程场景,先围观,等生态成熟了再上。Beta 版嘛,不必急。

AI工具

PicWish 评测:一个把抠图效率推到极致的在线工具

2026-6-4 10:32:07

skills资源

上周我让Claude画了张RAG架构图,效果让我直接卸掉Visio

2026-4-20 15:44:44

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧