-
PhoneBuddy:4B 小模型在真机上跑赢 GPT-5.4,腾讯混元是怎么做到的
正常人都觉得,能让 AI 替你操作手机,得靠 GPT-5.4 那种百亿参数的大模型。屏幕截图丢进去,它得看懂、得推理、得点对位置。4B 参数的小模型?光 UI 元素识别就应该把显存吃没了。但腾讯混元团队刚开源的 PhoneBuddy,偏不按这个剧本走。 在 150 个真实手机评测任务上,这个 4B 模型单 App 成功率 62%,GPT-5.4 是 50%。微信小程序 56% 对 40%。Andr…- 1.1k
- 0


