2026年3月,百度在安卓市场上线了一款叫「RedClaw」的应用。官方说法是“全球首款手机端OpenClaw应用”。
但你如果只是把它理解为“手机上能用的AI助手”,那就太浅了。
RedClaw背后,是百度对AI Agent落地路径的一次关键押注。

一、先搞清楚:RedClaw 到底是什么?
从功能层面描述,RedClaw确实能做很多事:
-
订机票、订火车票、订电影票
-
规划旅游行程
-
跨App下单外卖、打车
-
全网检索信息并整理成报告
-
优化手机系统
听起来像个高级版的语音助手?但它的底层逻辑和Siri、小爱同学完全不一样。
RedClaw不是“建议你怎么做”,而是“替你怎么做”。
你告诉它:“帮我订一张明天北京到上海的高铁票,二等座。”它不会给你返回一个搜索结果页面,而是直接打开12306,帮你完成选座、下单、支付的全流程。
这是两个概念:
-
语音助手:你问它答,最多给你一个链接
-
RedClaw:你告诉它目标,它操作你的手机
而实现这个能力的技术基础,是百度自研的ARM云服务 + VLA多模态大模型(视觉-语言-动作)。
二、技术层面:为什么是手机端?
做AI Agent的企业不止百度一家。阿里有「悟空」打企业市场,字节有Coze布局开发者生态,百度为什么选择在手机上做文章?
因为手机是普通人生活中最高频的智能终端,也是碎片化时间的主要载体。
你用电脑的时候,大概率是专注工作;你用手机的时候,更可能是碎片化场景——等电梯时查个航班、吃饭时顺便订个票、躺在沙发上刷着刷着就想起要干点啥。
在这种场景下,“动嘴皮子就能办事”的需求是真实存在的。
而且手机还有一个天然优势:它本身就是传感器和执行器的集合体。屏幕触控、摄像头拍照、麦克风录音、GPS定位——这些硬件能力让AI Agent有了“感知-理解-执行”的完整闭环。
三、架构解析:RedClaw 是怎么工作的?
根据公开信息,RedClaw的技术架构可以拆成三层:
1. 接入层:云手机
RedClaw并不在你的手机上本地运行AI模型。它实际上是在云端虚拟了一个“手机”,你的手机只是一个远程显示器和触控板。
这带来的几个直接好处:
-
0部署、0配置:用户不需要折腾任何技术环境,下载App就能用
-
跨平台潜力:理论上iOS也能用(只要百度开放)
-
算力不受限于手机性能:复杂任务交给云端处理
2. 模型层:VLA多模态大模型
VLA = Vision-Language-Action(视觉-语言-动作)。
传统的LLM(比如GPT-4)只能处理文字输入。VLA模型能看懂屏幕界面、理解当前状态,然后生成可执行的“动作序列”——比如“点击这里”、“输入这个”、“滑动到那里”。
这一步是整个链条中最难的。
3. 执行层:跨App操作
RedClaw能在不同的App之间跳转,完成需要多个应用配合的任务。比如订机票:打开航司App查航班 → 切换到支付App付款 → 最后把订单截图发给你。
这需要解决的问题包括:不同App的登录态管理、页面适配、执行容错等等。
四、为什么百度要做「龙虾全家桶」?
如果你关注AI圈,应该知道2026年这波AI Agent热潮有个外号叫“养龙虾”。
OpenClaw是开源的AI Agent框架,因为Logo是只龙虾,所以用OpenClaw做的AI Agent被戏称为“龙虾”。
百度这一波产品矩阵很有意思:
|
产品
|
定位
|
场景
|
|---|---|---|
|
DuMate
|
AI桌面助理
|
电脑办公
|
|
RedClaw
|
手机端Agent
|
移动生活
|
|
DuClaw
|
云端服务
|
零部署使用
|
|
小度龙虾
|
智能音箱
|
家庭场景
|
四个场景全覆盖:桌面、手机、云、家庭。
这不是简单的产品堆砌,而是有战略意图的:
-
桌面:解决办公场景的生产力问题
-
手机:解决日常生活中的碎片化需求
-
云:降低技术门槛,让不想折腾的用户也能用
-
家庭:抢占智能家居入口
百度集团执行副总裁沈抖在AI Day上说的那句话很关键:“AI Agent的核心价值在于成长性,从‘安装’到‘养成’的范式变革。”
这解释了为什么要做全家桶——用户养成一个“龙虾”,它应该在所有场景下都能为你服务,而不是每个场景单独训练。
五、和竞品比,RedClaw 强在哪?
这个问题要分两个维度来看:
1. 和传统语音助手比(Siri、小爱、小艺)
|
维度
|
传统语音助手
|
RedClaw
|
|---|---|---|
|
能力边界
|
回答问题、设闹钟
|
替你操作App、完成复杂任务
|
|
执行方式
|
给你结果
|
帮你办事
|
|
自动化程度
|
低
|
高
|
|
跨App能力
|
弱
|
强
|
2. 和同类Agent产品比(Claude App、智谱清言等)
|
维度
|
Claude App们
|
RedClaw
|
|---|---|---|
|
产品定位
|
对话+推理
|
任务自动化
|
|
执行能力
|
给建议、不操作手机
|
直接操作手机
|
|
部署门槛
|
0
|
0
|
|
生态整合
|
较弱
|
深度整合百度系服务
|
RedClaw的核心差异化在于:它不是来跟你聊天的,它是来替你干活的。
六、冷静看:RedClaw 面临哪些挑战?
任何新产品都有局限性,RedClaw也不例外:
1. 场景的碎片化是双刃剑
手机上的需求确实碎片,但正因为碎片,单次任务的价值往往不高。用户是否愿意为“订一张票”这种小事专门打开一个Agent?这一点需要验证。
2. 隐私和安全的敏感度
让一个AI操作你的手机本身就涉及隐私问题。虽然百度强调了安全隔离,但用户的心理门槛仍然存在——“它能看到我的银行App吗?”
3. iOS缺席
目前只支持安卓。对于苹果用户来说,体验不到这产品。而苹果用户的付费能力和生态粘性都是很高的。
4. 商业模式的考验
免费能撑多久?一旦收费,用户是否愿意为“手机上的自动化”付费?这需要时间来回答。
七、行业视角:RedClaw 意味着什么?
从百度一家的产品,上升到行业趋势,有几个判断:
1. AI Agent的入口争夺战正在从云端走向终端
过去一年,Agent产品主要集中在网页端和桌面端。2026年开始,移动端会成为新的战场。因为手机是离用户最近的设备,也是使用时长最长的设备。
2. 「执行」比「对话」更有商业价值
这是一个很现实的判断:能帮你干活的Agent,比只会聊天的Agent更容易变现。你让它订票,它可以抽佣;你让它买外卖,它可以推广——商业化的路径更清晰。
3. 云端+终端的混合架构会是主流
RedClaw用云手机的方式规避了端侧算力的限制,这个思路可能会被更多厂商效仿。端侧负责交互,云端负责推理和执行,各取所长。
结语
RedClaw不是百度突发奇想的产品,而是百度AI Agent战略的一环。
从桌面到手机,从云端到家庭,从DuMate到RedClaw,百度在做的其实是一件事:让AI从一个“工具”变成一个“可以替你干活的人”。
至于这个方向能不能跑通,用户说了算。
但有一点可以肯定:当AI开始替你操作手机的时候,这个世界已经不一样了。

百度加油,前面的龙虾大战反应太慢了。
现在大家又一窝蜂推手机版龙虾了🦞