刚刚，谢赛宁团队放出第二代表征自编码器 RAEv2

2026-5-22 8:50:39

AI 图像生成通常遵循「能力越强、代价越高」的铁律；与此同时，学界却在悄悄质疑另一个更根本的浪费：传统 VAE 对图像语义几乎一无所知，而 DINOv2、SigLIP 等视觉编码器早已从数亿张图片中习得了丰富的视觉常识。2025 年 10 月，纽约大学谢赛宁团队提出了「表征自编码器（Representation Autoencoder，RAE）」框架，首次系统性地将预训练视觉编码器引入扩散模型的潜在空间。预训练视觉编码器（DINOv2 等）则截然不同。

圈主管理员

热门评论

该帖子评论已关闭

图片审查中...

编辑答案：我的回答：最多上传一张图片和一个附件

表情

图片

附件

取消编辑

{{userData.name}}已认证

刚刚，谢赛宁团队放出第二代表征自编码器 RAEv2

偷瞄答案

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议

{{userData.name}}已认证

刚刚，谢赛宁团队放出第二代表征自编码器 RAEv2

偷瞄答案

您还未加入该AI圈子

相似站点

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议