今天,阶跃正式发布新一代图像生成编辑模型 Step Image Edit 2。
这是一款主打极速响应、高质量输出的轻量级模型,小身材、大能力、快响应!
其参数量仅为 3.5B,但在实际表现中实现了对 12B-20B 级开源图像编辑大模型的跨量级超越,单次生图仅需 0.5-2s。
核心提供图像生成与图像编辑两项能力,支持中英文渲染、局部编辑、视觉推理、主体一致性、风格迁移等。可覆盖 IP 创作、海报设计、漫画生成、人像美颜、旅游修图、写真生成等实际场景需求。
在公开学术榜单 KRIS-Bench 上轻量级图像编辑模型综合排名第一。

我们希望通过这款模型重新定义轻量级图像编辑模型的能力边界,让高质量模型更好用、随时用、用得起。
目前 Step Image Edit 2 已全量上线「阶跃星辰开放平台」和 Step Plan,4 月 29 日-5 月 5 日限时免费,欢迎大家前往体验!
-
阶跃星辰开放平台:https://platform.stepfun.com/docs/zh/guides/models/step-image-edit-2
-
Step Plan:https://platform.stepfun.com/docs/zh/step-plan/integrations/image-api
架构数据双突破
能够又小又快又好,源于 Step Image Edit 2 以下几方面创新——
1.多专家驱动的自演化学习(Multi-Expert Self-Evolution Learning)
我们提出了一种基于多专家集成的自演化训练框架,核心目标是突破轻量化图像编辑模型的能力上限。
整体思路可以概括为“分头探索、集中聚合”两个阶段:首先,通过从基座模型衍生多个细分任务专家分支实现差异化训练探索,从而在复杂、高噪声的原始数据内高效捕捉高质量、高多样性的编辑轨迹;随后,通过迭代式自蒸馏,将细分专家积累的知识聚合至基座模型,使其在不增加参数规模的前提下,获得显著超越原有能力上限的编辑效果。这一机制实现了模型能力与模型体量之间的非线性跨越——用轻量级模型的资源成本,逼近甚至达到大模型的表现水平。
2.分布匹配强化学习(Distributional Alignment Reinforcement Learning, DARL)
我们提出了一种新的机制,来解决传统强化学习奖励信号稀疏且方差大的问题。
我们将强化学习的优化目标重新定义为:让模型当前的输出分布与参考分布保持对齐,而非依赖传统的单点奖励信号。简单来说,就是不再只看模型某一次输出的好坏,而是将模型当前的整体输出与参考输出进行全面对比,以两者之间的分布差距作为奖励信号。由此可以有效避免在少量样本、单一维度上评估导致的偏差。这种稠密奖励机制也能使模型在复杂任务中的训练过程更加平稳、泛化能力更强。
3.数据质量与规模双重突破
此外在数据方面,Step Image Edit 2 在图像编辑能力上投入了超五千万规模的专项训练数据,融合真实场景挖掘、定向合成与高质量开源数据三路来源,并针对文字编辑这一行业难点,自研排版系统生成两千万条专项数据,实现对文字渲染与修改能力的精准强化。在数据质量把控上,我们构建了“智能体自动清洗—大模型全局评估—人工精细筛选”的三级质控体系,确保训练数据在质量与分布上达到高标准,使模型生成结果更贴合用户的真实编辑需求。
现在,Step Image Edit 2 已全面上线!欢迎大家体验!
本文转载自阶跃星辰公众号,原文连接
https://mp.weixin.qq.com/s/iHlnN2YGafxWweVLCP2–g
