实战分享:从单纯编码到全模态智能:解读火山引擎Agent Plan的优势

你可能对Coding Plan耳熟能详了,但是,字节家火山引擎这个卷王又卷出了新高度,搞了个Agent Plan

image

怎么理解Agent Plan呢?

Coding Plan只能用来覆盖coding过程消耗的token,而Agent Plan是除了coding token之外,你还可以调用绘图工具(背后是Seedream5.0)、视频生成工具(背后是大名鼎鼎的seedance2.0)、联网搜索、embedding等Harness工具,所以:

Agent Plan = Coding Plan + Image生成+ Video生成+ 其他工具链

(btw,豆包TTS2.0这个TTS性价比之王为啥没加进来啊?)

这样,你就不用为每个AIGC服务单独去接一套API了!

这对我来说简直是天降甘霖!

如果你读过我之前的文章,可能知道我为自媒体工作流封装了一整套20多个skills,其中涉及文本、视频、图片几乎所有AIGC工具:

仓库地址: https://github.com/dracohu2025-cloud/draco-skills-collection

image

问题是:虽然skills源代码都在Github上,但每多一个Agent员工(我目前手下有8个Hermes Agent员工)总是要把.env环境变量复制粘贴一遍,然后做一轮整体调试和验证…纯机械工作费时费力…

这下好,Agent Plan都给包进去了!省事儿省大发了~

OK,不废话了,下面是保姆攻略(my style😂),两大部分:

第一部分:获取和配置Agent Plan
第二部分:玩转Agent Plan

第一部分:获取和配置Agent Plan

获取Agent Plan


访问火山方舟Agent Plan页面:https://www.volcengine.com/activity/agentplan
image
把这个页面划到中间位置能看到4档套餐,默认推荐Medium这档:

我用的也是这档:

1.
最低档用不了Seedance!不能生视频的Agent不是好牛马~
2.
Medium及以上档位会送个ArkClaw轻量版实例
image
购买就是个支付宝扫码,就不放截图了
开通成功之后进来是这个样子:
image
注意:Agent Plan 引入了 AFP (Agent Fuel Points, Agent 燃料值)作为统一的资源计量单位

本质上就是一种Credits嘛…

5小时1万点,每周3.5万点,每个月10万点;

等会儿我们来测测这个AFP在不同任务中消耗的量,见后文

image
路由大模型支持以下这些(国内各家一线模型基本都支持了):
image
记得要在“配置Harness”这里先打开联网搜索能力(点击“领取权益”按钮开通):
image
image

配置Agent Plan

将Agent Plan配置到已有的Agent上

先以Hermes Agent为例~ 其实官方已经有个写的很不错的文档了:volcengine.com/docs/82379/2373743

不过,我还是在这里带着大家走一遍~

方法一:使用Ark Helper
在Agent所在机器的终端中输入下方的指令:
curl -fsSL https://lf3-static.bytednsdoc.com/obj/eden-cn/ylwslo-yrh/ljhwZthlaukjlkulzlp/install.sh | sh
image
输入下面的指令验证安装是否成功:
ark-helper --version
image
在命令行输入:
ark-helper
会弹出Ark Helper的TUI界面,选中文即可,然后点回车键:
image
这里选择Agent Plan,然后回车键:
image
选“SSO 登录自动获取 API Key 和联网密钥”,然后回车键:
image
复制这串链接在浏览器中打开:
image
在火山引擎登录:
image
选择模型,这里默认选择ark-code-latest:
image
这里多说一嘴,如果选择ark-code-latest,默认对应的是火山引擎后台的Auto模型,在Agent工作过程中会模型路由会智能判断哪个模型最适合承接工作,你也可以在后台手动切换到其他自己用着顺手的模型~ 我推荐这个模式!
image
然后继续在命令行中选择“退出”即可,然后回车键(或者连续“返回”两个层级):
image
然后再次输入 ark-helper,选择“工具配置”:
image
选择你要配置的Agent(我这里选择“Hermes Agent”):
image
选择“设置 Volcano Agent Plan (API Key) 到 Hermes Agent”:
image
配置成功,回车返回:
image
选择“退出”即可:
image
然后找到对应的Hermes Agent实例,在对话中/reset一下,就能看到更新后的模型了:
image

OK,的确是刚才选择的ark-code-latest

方法二:手动配置

如果你不打算使用ark-helper,那么你可以采用手动配置custom endpoint的方式,步骤如下:

在命令行输入下面的命令(假设是Hermes Agent):
hermes model
点击空格键:
image
API Base URL输入:
https://ark.cn-beijing.volces.com/api/plan/v3
然后回车:
image
访问 https://console.volcengine.com/ark/region:ark+cn-beijing/openManagement?LLM=%7B%7D&OpenModelVisible=false&advancedActiveKey=agentPlan把API KEY复制出来:
image
粘贴到命令行中(注意,为了隐私,这里屏幕上不会显示你的API KEY,直接回车即可):
image
这步直接回车即可:
image
填写Model Name,可以从 https://www.volcengine.com/docs/82379/2366394?lang=zh#3d801f5f 中复制粘贴,比如这里面有deepseek-v4-pro-beta,直接粘贴到命令行中~
image
Model Name直接把从上面页面中复制出来的名字粘贴进去,上下文窗口Context length和Display Name直接回车即可:
image
再回到Hermes Agent聊天窗口中 /reset 一下,果然看到是deepseek-v4-pro-beta
image
哦对了,如果想在飞书中使用Hermes,需要输入 /model hermes 否则默认是个纯龙虾…
image

我是以Hermes Agent作为demo对象,其他Agent可以访问火山引擎提供的文档站:https://www.volcengine.com/docs/82379/2373738?lang=zh  每种Agent都有详细的教程~

image

OK,你现在已经给自己的Agent配置好了Agent Plan,接下来,让我们一起玩转它!

ArkClaw

除了自己的Agent,还可以使用官方的的ArkClaw:

访问https://console.volcengine.com/arkclaw/management
image
如果已经创建过,记得将ArkClaw升级到最新版
如果没有创建过,则点击右上角“创建ArkClaw”即可~
官方最新版ArkClaw都默认支持Agent Plan,这里不再赘述

第二部分:玩转Agent Plan

部分案例基于 飞书+Hermes/OpenClaw,部分案例基于ArkClaw网页版,模型采用‘ark-code-latest’,偶尔会在控制台切换到特定的原生多模态模型执行特定任务,后文不再另行说明~

案例1:自媒体工作流skills的安装和适配

先让Agent将我自己封装的Draco-Skill-Collection仓库中的skills安装好
image

速度非常快,20个左右skills,大概两三分钟就搞定了;

然后,让Agent在Github仓库里创建一个Agent Plan专用Skills集合并完成所有Skills的改造以适配:

比如用seedream替换nano banana,以及Agent Plan自带的seedream/seedance代替需要通过API KEY打通的seedream/seedance等…

image
大概5分钟之后,全搞定:
image

唯一例外的是目前Agent Plan不支持火山引擎TTS,因此需要通过下面的方式将参数传入:

openclaw config set env.VOLCENGINE_ACCESS_TOKEN “你的ACCESS TOKEN”

openclaw config set env.VOLCENGINE_TTS_APP_ID “你的TTS APP ID”

openclaw config get env

截止目前,以上任务一共消耗AFP点数1400左右
image
从现在开始,如果我继续扩展Agent员工,就可以让它们下载这个新创建的Agent Plan的专版skills集合了:https://github.com/dracohu2025-cloud/draco-skills-collection/tree/main/Ark%20Agent%20Plan%20Version 目前共支持17个Skills,涵盖了基于飞书体系的信源抓取、日报撰写推送归档、飞书文档推送公众号、公众号封面生成、AI短剧管线、播客生成、Hyperframes/Manim/Remotion、英文单词教学视频生成等一系列skills~
image

案例2:多模态网站构建

Agent Plan中最终要的是啥?多模态能力!对应的就是字节家的seedream5.0(生图)和seedance2.0(生视频)!

小试牛刀先来画个折纸女孩:
image
然后再用这张图生成视频:
image
OK,没毛病,seedream和seedance能力都通了!
注意:如果你的OpenClaw/Hermes无法识别seedream和seedance,告诉你的Agent,用下面指令自己把seedream和seedance的skills重新安装一下:
npx skills add https://skills.volces.com/skills/volcengine/agentplan -s byted-ark-seedance-skill --agent openclaw
npx skills add https://skills.volces.com/skills/volcengine/agentplan -s byted-ark-seedream-skill --agent openclaw

这个skill默认是支持OpenClaw的,但Hermes如果不笨的话,它自己会安装好之后挪到自己的workspace下面,如果它太笨,就提醒它把这俩skills安装到自己的workspace下面~

BTW,一张图片大概消耗几十个AFP值,但是生成视频会消耗几百个AFP值~ 具体的数值和图片/视频的分辨率、时长等相关~

接下来,让我们完成一个多模态网站的任务:“动漫风格馆”

让Agent利用seedream5.0和seedance2.0的生图和生视频能力制作一个“动漫风格馆”,集萃全世界著名的动漫风格~

网站已经上线:https://dracohu2025-cloud.github.io/manga-style-gallery/

HERO Video(哈哈哈~ 请忽略两个绿巨人的问题)

image
image
image
实战分享:从单纯编码到全模态智能:解读火山引擎Agent Plan的优势

案例1和案例2合在一起,基本意味着,你可以把飞书+Agent Plan当成你的“数字座舱”,可以写文章、推送到公众号、生成播客、生成图片、生成视频、创建多模态网站….等等等等

在这个过程中,你几乎不需要触碰若干个不同工具的GUI,只需要和Agent交互就能得到想要的一切!

案例3:专业数据查询

首先,你需要打开ArkClaw的“专业数据库”功能:
image
打开这个按钮:
image
首次打开会提示你没有安装专业数据库的插件,那就“立即安装”:
image
会弹出终端界面,有个安装过程,并且会重启:
image
安装之后可以看到启用专业数据库的按钮已经处于打开状态了:
image
然后你就可以问它是否能取到“中国金融数据集”的数据了,服务正常的话它会确认并返回它取到的一些数据:
image
OK,可以尝试一些具体例子(这个是在ArkClaw网页端测试的):

Case1:

帮我从中国金融数据集中查询和分析招商银行过去5年的盈利能力是否承压

ArkClaw输出的内容如下:

基于获取的招商银行财务数据,现将过去5年盈利能力分析报告如下:

📊 招商银行过去5年盈利能力核心指标

注:2025年数据为全年数据,统计截止2025年12月31日


🔍 关键发现与分析
1. 净资产收益率(ROE)持续下行,盈利能力承压明显
从2021年的16.96%下降至2025年的13.44%,5年累计下降3.52个百分点
下降趋势持续且稳定,表明核心盈利能力面临较大压力
2024-2025年下降速率有所放缓,但整体下行趋势未变
2. 净利润增长陷入停滞
2023年净利润同比增速降至0%,增长陷入停滞
2024-2025年虽恢复正增长,但增速仅约1.2%,远低于2021年23.2%的高增速
营收在2024-2025年连续两年维持3375亿元水平,规模增长乏力
3. 净利率逆势提升,成本管控成效显著
净利率从2021年的36.18%提升至2025年的44.77%
银行通过优化成本结构、提升运营效率来对冲营收增长乏力的压力
这也是净利润维持正增长的主要支撑因素
4. 总资产收益率同步下行
2025年总资产收益率仅1.20%,低于2024年的1.29%
反映出银行整体资产运用效率有所下降

⚠️ 主要压力来源分析
1.
宏观经济环境:经济增速放缓导致有效信贷需求不足
2.
利率市场化:LPR持续下行,净息差收窄压力较大
3.
行业竞争加剧:银行业同质化竞争激烈,零售业务面临多方挑战
4.
资产质量压力:房地产等领域风险暴露,拨备计提压力增加

📈 结论

招商银行过去5年盈利能力确实面临持续承压,主要体现为:

✅ ROE持续下行:从16.96%降至13.44%,核心盈利能力减弱
✅ 增长动能不足:营收增长停滞,净利润增速大幅放缓
✅ 效率支撑利润:净利率提升主要依靠成本管控,而非收入端扩张

虽然通过精细化管理维持了净利率的提升,但核心盈利能力指标ROE的持续下行反映了银行业整体面临的经营困境。未来招商银行需要在财富管理、零售银行等优势领域进一步突破,寻找新的盈利增长点。


Case2:

企业风险数据集 恒大集团涉及多少起诉讼?分别是什么类型的案件?有多少是已结案的?

image

我对于此类数据诉求不多,就不展开更多案例了


写在最后

在3月底开始使用Hermes之后,我每天跟Agent打交道的时间可能已经超过了6小时,已经大幅度超过了和人交互的时间,在这个过程中,我有个强烈的感受:

Agent这场战争,全模态者为王!

在全模态都拥有SOTA(最先进)模型的厂商将获得最终的胜利~

海外的话,OpenAI是有这个优势的,这就是为啥最近很多人会觉得用了Codex之后就回不去Claude Code了… GPT-5.5的coding能力强是一方面,另一方面就是在coding过程中GPT-Image-2能直接帮你把视觉物料都准备好,真的可以实现一站式coding~

再看国内,我觉得目前字节领先,编程、绘图、视频、音频等模型在各细分领域都基本处在第一梯队,阿里紧随其后,然后是逐渐发力的腾讯和也拥有全模态能力的MiniMax并列第三,其他家基本都还在卷大模型的编程能力… 但各家编程能力不相伯仲那天,图片、视频、音频等内容的生成能力才是胜负手~ 毕竟,人本来就是多模态生物,能看到能听到才是王道!

行业动态

万字解读 Avi Chawla《2026 LLM工程师路线图》,8 层能力框架看 AI 应用工程

2026-5-17 9:02:49

行业动态

Vidu Q2携「王炸」登场!杀手锏「参考生」功能全球上线,APP体验全面革新

2025-10-21 10:32:41

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧