实战分享：从单纯编码到全模态智能：解读火山引擎Agent Plan的优势

你可能对Coding Plan耳熟能详了，但是，字节家火山引擎这个卷王又卷出了新高度，搞了个Agent Plan：

怎么理解Agent Plan呢？

Coding Plan只能用来覆盖coding过程消耗的token，而Agent Plan是除了coding token之外，你还可以调用绘图工具（背后是Seedream5.0）、视频生成工具（背后是大名鼎鼎的seedance2.0）、联网搜索、embedding等Harness工具，所以：

Agent Plan = Coding Plan + Image生成+ Video生成+ 其他工具链

（btw，豆包TTS2.0这个TTS性价比之王为啥没加进来啊？）

这样，你就不用为每个AIGC服务单独去接一套API了！

这对我来说简直是天降甘霖！

如果你读过我之前的文章，可能知道我为自媒体工作流封装了一整套20多个skills，其中涉及文本、视频、图片几乎所有AIGC工具：

仓库地址： https://github.com/dracohu2025-cloud/draco-skills-collection

问题是：虽然skills源代码都在Github上，但每多一个Agent员工（我目前手下有8个Hermes Agent员工）总是要把.env环境变量复制粘贴一遍，然后做一轮整体调试和验证…纯机械工作费时费力…

这下好，Agent Plan都给包进去了！省事儿省大发了～

OK，不废话了，下面是保姆攻略（my style😂），两大部分：

•

第一部分：获取和配置Agent Plan

•

第二部分：玩转Agent Plan

第一部分：获取和配置Agent Plan

获取Agent Plan

•

访问火山方舟Agent Plan页面：https://www.volcengine.com/activity/agentplan

•

把这个页面划到中间位置能看到4档套餐，默认推荐Medium这档：

我用的也是这档:

1.
最低档用不了Seedance！不能生视频的Agent不是好牛马～

2.
Medium及以上档位会送个ArkClaw轻量版实例

•

购买就是个支付宝扫码，就不放截图了

•

开通成功之后进来是这个样子：

•

注意：Agent Plan 引入了 AFP (Agent Fuel Points, Agent 燃料值）作为统一的资源计量单位

本质上就是一种Credits嘛…

5小时1万点，每周3.5万点，每个月10万点；

等会儿我们来测测这个AFP在不同任务中消耗的量，见后文

•

路由大模型支持以下这些（国内各家一线模型基本都支持了）：

•

记得要在“配置Harness”这里先打开联网搜索能力（点击“领取权益”按钮开通）：

配置Agent Plan

将Agent Plan配置到已有的Agent上

先以Hermes Agent为例～其实官方已经有个写的很不错的文档了：volcengine.com/docs/82379/2373743

不过，我还是在这里带着大家走一遍～

方法一：使用Ark Helper

•

在Agent所在机器的终端中输入下方的指令：

curl -fsSL https://lf3-static.bytednsdoc.com/obj/eden-cn/ylwslo-yrh/ljhwZthlaukjlkulzlp/install.sh | sh

•

输入下面的指令验证安装是否成功：

ark-helper --version

•

在命令行输入：

ark-helper

•

会弹出Ark Helper的TUI界面，选中文即可，然后点回车键：

•

这里选择Agent Plan，然后回车键：

•

选“SSO 登录自动获取 API Key 和联网密钥”，然后回车键：

•

复制这串链接在浏览器中打开：

•

在火山引擎登录：

•

选择模型，这里默认选择ark-code-latest：

•

这里多说一嘴，如果选择ark-code-latest，默认对应的是火山引擎后台的Auto模型，在Agent工作过程中会模型路由会智能判断哪个模型最适合承接工作，你也可以在后台手动切换到其他自己用着顺手的模型～我推荐这个模式！

•

然后继续在命令行中选择“退出”即可，然后回车键（或者连续“返回”两个层级）：

•

然后再次输入 ark-helper，选择“工具配置”：

•

选择你要配置的Agent（我这里选择“Hermes Agent”）：

•

选择“设置 Volcano Agent Plan (API Key) 到 Hermes Agent”：

•

配置成功，回车返回：

•

选择“退出”即可：

•

然后找到对应的Hermes Agent实例，在对话中/reset一下，就能看到更新后的模型了：

OK，的确是刚才选择的ark-code-latest

方法二：手动配置

如果你不打算使用ark-helper，那么你可以采用手动配置custom endpoint的方式，步骤如下：

•

在命令行输入下面的命令（假设是Hermes Agent）：

hermes model

•

点击空格键：

•

API Base URL输入：

https://ark.cn-beijing.volces.com/api/plan/v3

•

然后回车：

•

访问 https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement?LLM=%7B%7D&OpenModelVisible=false&advancedActiveKey=agentPlan把API KEY复制出来：

•

粘贴到命令行中（注意，为了隐私，这里屏幕上不会显示你的API KEY，直接回车即可）：

•

这步直接回车即可：

•

填写Model Name，可以从 https://www.volcengine.com/docs/82379/2366394?lang=zh#3d801f5f 中复制粘贴，比如这里面有deepseek-v4-pro-beta，直接粘贴到命令行中～

•

Model Name直接把从上面页面中复制出来的名字粘贴进去，上下文窗口Context length和Display Name直接回车即可：

•

再回到Hermes Agent聊天窗口中 /reset 一下，果然看到是deepseek-v4-pro-beta

•

哦对了，如果想在飞书中使用Hermes，需要输入 /model hermes 否则默认是个纯龙虾…

我是以Hermes Agent作为demo对象，其他Agent可以访问火山引擎提供的文档站：https://www.volcengine.com/docs/82379/2373738?lang=zh 每种Agent都有详细的教程～

OK，你现在已经给自己的Agent配置好了Agent Plan，接下来，让我们一起玩转它！

ArkClaw

除了自己的Agent，还可以使用官方的的ArkClaw：

•

访问https://console.volcengine.com/arkclaw/management

•

如果已经创建过，记得将ArkClaw升级到最新版

•

如果没有创建过，则点击右上角“创建ArkClaw”即可～

•

官方最新版ArkClaw都默认支持Agent Plan，这里不再赘述

第二部分：玩转Agent Plan

部分案例基于飞书+Hermes/OpenClaw，部分案例基于ArkClaw网页版，模型采用‘ark-code-latest’，偶尔会在控制台切换到特定的原生多模态模型执行特定任务，后文不再另行说明～

案例1：自媒体工作流skills的安装和适配

•

先让Agent将我自己封装的Draco-Skill-Collection仓库中的skills安装好

速度非常快，20个左右skills，大概两三分钟就搞定了；

•

然后，让Agent在Github仓库里创建一个Agent Plan专用Skills集合并完成所有Skills的改造以适配：

比如用seedream替换nano banana，以及Agent Plan自带的seedream/seedance代替需要通过API KEY打通的seedream/seedance等…

•

大概5分钟之后，全搞定：

唯一例外的是目前Agent Plan不支持火山引擎TTS，因此需要通过下面的方式将参数传入：

openclaw config set env.VOLCENGINE_ACCESS_TOKEN “你的ACCESS TOKEN”

openclaw config set env.VOLCENGINE_TTS_APP_ID “你的TTS APP ID”

openclaw config get env

•

截止目前，以上任务一共消耗AFP点数1400左右

•

从现在开始，如果我继续扩展Agent员工，就可以让它们下载这个新创建的Agent Plan的专版skills集合了：https://github.com/dracohu2025-cloud/draco-skills-collection/tree/main/Ark%20Agent%20Plan%20Version 目前共支持17个Skills，涵盖了基于飞书体系的信源抓取、日报撰写推送归档、飞书文档推送公众号、公众号封面生成、AI短剧管线、播客生成、Hyperframes/Manim/Remotion、英文单词教学视频生成等一系列skills～

案例2：多模态网站构建

Agent Plan中最终要的是啥？多模态能力！对应的就是字节家的seedream5.0（生图）和seedance2.0（生视频）！

•

小试牛刀先来画个折纸女孩：

•

然后再用这张图生成视频：

•

OK，没毛病，seedream和seedance能力都通了！

•

注意：如果你的OpenClaw/Hermes无法识别seedream和seedance，告诉你的Agent，用下面指令自己把seedream和seedance的skills重新安装一下：

npx skills add https://skills.volces.com/skills/volcengine/agentplan -s byted-ark-seedance-skill --agent openclaw
npx skills add https://skills.volces.com/skills/volcengine/agentplan -s byted-ark-seedream-skill --agent openclaw

这个skill默认是支持OpenClaw的，但Hermes如果不笨的话，它自己会安装好之后挪到自己的workspace下面，如果它太笨，就提醒它把这俩skills安装到自己的workspace下面～

•

BTW，一张图片大概消耗几十个AFP值，但是生成视频会消耗几百个AFP值～具体的数值和图片/视频的分辨率、时长等相关～

•

接下来，让我们完成一个多模态网站的任务：“动漫风格馆”

让Agent利用seedream5.0和seedance2.0的生图和生视频能力制作一个“动漫风格馆”，集萃全世界著名的动漫风格～

•

网站已经上线：https://dracohu2025-cloud.github.io/manga-style-gallery/

HERO Video（哈哈哈～请忽略两个绿巨人的问题）

案例1和案例2合在一起，基本意味着，你可以把飞书+Agent Plan当成你的“数字座舱”，可以写文章、推送到公众号、生成播客、生成图片、生成视频、创建多模态网站….等等等等

在这个过程中，你几乎不需要触碰若干个不同工具的GUI，只需要和Agent交互就能得到想要的一切！

案例3：专业数据查询

•

首先，你需要打开ArkClaw的“专业数据库”功能：

•

打开这个按钮：

•

首次打开会提示你没有安装专业数据库的插件，那就“立即安装”：

•

会弹出终端界面，有个安装过程，并且会重启：

•

安装之后可以看到启用专业数据库的按钮已经处于打开状态了：

•

然后你就可以问它是否能取到“中国金融数据集”的数据了，服务正常的话它会确认并返回它取到的一些数据：

•

OK，可以尝试一些具体例子（这个是在ArkClaw网页端测试的）：

Case1：

帮我从中国金融数据集中查询和分析招商银行过去5年的盈利能力是否承压

ArkClaw输出的内容如下：

基于获取的招商银行财务数据，现将过去5年盈利能力分析报告如下：

📊 招商银行过去5年盈利能力核心指标

注：2025年数据为全年数据，统计截止2025年12月31日

🔍 关键发现与分析

1. 净资产收益率(ROE)持续下行，盈利能力承压明显

•

从2021年的16.96%下降至2025年的13.44%，5年累计下降3.52个百分点

•

下降趋势持续且稳定，表明核心盈利能力面临较大压力

•

2024-2025年下降速率有所放缓，但整体下行趋势未变

2. 净利润增长陷入停滞

•

2023年净利润同比增速降至0%，增长陷入停滞

•

2024-2025年虽恢复正增长，但增速仅约1.2%，远低于2021年23.2%的高增速

•

营收在2024-2025年连续两年维持3375亿元水平，规模增长乏力

3. 净利率逆势提升，成本管控成效显著

•

净利率从2021年的36.18%提升至2025年的44.77%

•

银行通过优化成本结构、提升运营效率来对冲营收增长乏力的压力

•

这也是净利润维持正增长的主要支撑因素

4. 总资产收益率同步下行

•

2025年总资产收益率仅1.20%，低于2024年的1.29%

•

反映出银行整体资产运用效率有所下降

⚠️ 主要压力来源分析

宏观经济环境：经济增速放缓导致有效信贷需求不足

利率市场化：LPR持续下行，净息差收窄压力较大

行业竞争加剧：银行业同质化竞争激烈，零售业务面临多方挑战

资产质量压力：房地产等领域风险暴露，拨备计提压力增加

📈 结论

招商银行过去5年盈利能力确实面临持续承压，主要体现为：

•

✅ ROE持续下行：从16.96%降至13.44%，核心盈利能力减弱

•

✅ 增长动能不足：营收增长停滞，净利润增速大幅放缓

•

✅ 效率支撑利润：净利率提升主要依靠成本管控，而非收入端扩张

虽然通过精细化管理维持了净利率的提升，但核心盈利能力指标ROE的持续下行反映了银行业整体面临的经营困境。未来招商银行需要在财富管理、零售银行等优势领域进一步突破，寻找新的盈利增长点。

Case2：

企业风险数据集恒大集团涉及多少起诉讼？分别是什么类型的案件？有多少是已结案的？

我对于此类数据诉求不多，就不展开更多案例了

写在最后

在3月底开始使用Hermes之后，我每天跟Agent打交道的时间可能已经超过了6小时，已经大幅度超过了和人交互的时间，在这个过程中，我有个强烈的感受：

Agent这场战争，全模态者为王！

在全模态都拥有SOTA（最先进）模型的厂商将获得最终的胜利～

海外的话，OpenAI是有这个优势的，这就是为啥最近很多人会觉得用了Codex之后就回不去Claude Code了… GPT-5.5的coding能力强是一方面，另一方面就是在coding过程中GPT-Image-2能直接帮你把视觉物料都准备好，真的可以实现一站式coding～

再看国内，我觉得目前字节领先，编程、绘图、视频、音频等模型在各细分领域都基本处在第一梯队，阿里紧随其后，然后是逐渐发力的腾讯和也拥有全模态能力的MiniMax并列第三，其他家基本都还在卷大模型的编程能力… 但各家编程能力不相伯仲那天，图片、视频、音频等内容的生成能力才是胜负手～毕竟，人本来就是多模态生物，能看到能听到才是王道！

{{userData.name}}已认证

实战分享：从单纯编码到全模态智能：解读火山引擎Agent Plan的优势

第一部分：获取和配置Agent Plan

获取Agent Plan

配置Agent Plan

将Agent Plan配置到已有的Agent上

方法一：使用Ark Helper

方法二：手动配置

ArkClaw

第二部分：玩转Agent Plan

案例1：自媒体工作流skills的安装和适配

案例2：多模态网站构建

案例3：专业数据查询

Case1：

📊 招商银行过去5年盈利能力核心指标

🔍 关键发现与分析

1. 净资产收益率(ROE)持续下行，盈利能力承压明显

2. 净利润增长陷入停滞

3. 净利率逆势提升，成本管控成效显著

4. 总资产收益率同步下行

⚠️ 主要压力来源分析

📈 结论

Case2：

写在最后

万字解读 Avi Chawla《2026 LLM工程师路线图》，8 层能力框架看 AI 应用工程

在回北京的火车上，我看完了姚顺宇的 AI 播客，大为震撼

AI Agent 的 Skill 系统设计

向量检索、知识图谱与 LLM Wiki：RAG 被嘲笑了三年，但企业还是离不开它

AI互联网日报：阿里整合 QoderWork、悟空和 MuleRun；Kimi 推出语音通话模式；Gemini Spark 登陆 Mac

computer-science：是一张通往硅谷的船票吗？

javascript-algorithms：前端学算法的第一站

spreadsheet：一个会写公式的 Excel 助手

data-visualization：把选图决策做成了可复用知识

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议