官宣：阶跃 Step Image Edit 2 上线！小身材、大能力、快响应

今天，阶跃正式发布新一代图像生成编辑模型 Step Image Edit 2。

这是一款主打极速响应、高质量输出的轻量级模型，小身材、大能力、快响应！

其参数量仅为 3.5B，但在实际表现中实现了对 12B-20B 级开源图像编辑大模型的跨量级超越，单次生图仅需 0.5-2s。

核心提供图像生成与图像编辑两项能力，支持中英文渲染、局部编辑、视觉推理、主体一致性、风格迁移等。可覆盖 IP 创作、海报设计、漫画生成、人像美颜、旅游修图、写真生成等实际场景需求。

在公开学术榜单 KRIS-Bench 上轻量级图像编辑模型综合排名第一。

我们希望通过这款模型重新定义轻量级图像编辑模型的能力边界，让高质量模型更好用、随时用、用得起。

目前 Step Image Edit 2 已全量上线「阶跃星辰开放平台」和 Step Plan，4 月 29 日-5 月 5 日限时免费，欢迎大家前往体验！

阶跃星辰开放平台：https://platform.stepfun.com/docs/zh/guides/models/step-image-edit-2
Step Plan：https://platform.stepfun.com/docs/zh/step-plan/integrations/image-api

架构数据双突破

能够又小又快又好，源于 Step Image Edit 2 以下几方面创新——

1.多专家驱动的自演化学习（Multi-Expert Self-Evolution Learning）

我们提出了一种基于多专家集成的自演化训练框架，核心目标是突破轻量化图像编辑模型的能力上限。

整体思路可以概括为“分头探索、集中聚合”两个阶段：首先，通过从基座模型衍生多个细分任务专家分支实现差异化训练探索，从而在复杂、高噪声的原始数据内高效捕捉高质量、高多样性的编辑轨迹；随后，通过迭代式自蒸馏，将细分专家积累的知识聚合至基座模型，使其在不增加参数规模的前提下，获得显著超越原有能力上限的编辑效果。这一机制实现了模型能力与模型体量之间的非线性跨越——用轻量级模型的资源成本，逼近甚至达到大模型的表现水平。

2.分布匹配强化学习（Distributional Alignment Reinforcement Learning, DARL）

我们提出了一种新的机制，来解决传统强化学习奖励信号稀疏且方差大的问题。

我们将强化学习的优化目标重新定义为：让模型当前的输出分布与参考分布保持对齐，而非依赖传统的单点奖励信号。简单来说，就是不再只看模型某一次输出的好坏，而是将模型当前的整体输出与参考输出进行全面对比，以两者之间的分布差距作为奖励信号。由此可以有效避免在少量样本、单一维度上评估导致的偏差。这种稠密奖励机制也能使模型在复杂任务中的训练过程更加平稳、泛化能力更强。

3.数据质量与规模双重突破

此外在数据方面，Step Image Edit 2 在图像编辑能力上投入了超五千万规模的专项训练数据，融合真实场景挖掘、定向合成与高质量开源数据三路来源，并针对文字编辑这一行业难点，自研排版系统生成两千万条专项数据，实现对文字渲染与修改能力的精准强化。在数据质量把控上，我们构建了“智能体自动清洗—大模型全局评估—人工精细筛选”的三级质控体系，确保训练数据在质量与分布上达到高标准，使模型生成结果更贴合用户的真实编辑需求。

现在，Step Image Edit 2 已全面上线！欢迎大家体验！

本文转载自阶跃星辰公众号，原文连接

https://mp.weixin.qq.com/s/iHlnN2YGafxWweVLCP2–g