2023 年,阿里妈妈将生成式 AI 引入自动出价任务中,首次提出”生成式出价算法”(AI-Generated Bidding, AIGB),创造性地将这一复杂的序列决策问题重构为”条件生成”任务,有效规避了离线强化学习算法面对长序列决策时累计误差较大的痛点 … 2025 年初开始,阿里妈妈联合清华大学自动化系季向阳教授团队提出了基于强化学习后训练的增强版 AIGB 算法:AIGB-Pearl(Planning with EvaluAtor via RL) … 基于这一理论分析,团队提出基于 Lipschitz+KL 的双约束的强化学习生成式出价算法 AIGB-Pearl(Planning with EvaluAtor via RL)。

