字节会师何恺明！开源连续扩散语言模型Cola DLM

2026-5-19 12:42:40

继何恺明之后，字节也给出了同样的回答：NO。而字节这次带来的Cola DLM（Continuous Latent Diffusion Language Model），则进一步佐证了这一趋势。他们同样选择跳出离散token的束缚，把生成过程交给连续空间，结果是：在~2B参数、约2000 EFLOPs的严格对照实验下，Cola DLM展现出了比自回归模型和主流离散DLM更稳定的scaling趋势。字节：Token≠语义，表征才是真正的主角事实上，真正的主角藏在这句话的后半段： Cola DLM的motivation从来不是diffusion，而是representation（表征）。

圈主管理员

热门评论

该帖子评论已关闭

图片审查中...

编辑答案：我的回答：最多上传一张图片和一个附件

表情

图片

附件

取消编辑

{{userData.name}}已认证

字节会师何恺明！开源连续扩散语言模型Cola DLM

偷瞄答案

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议

{{userData.name}}已认证

字节会师何恺明！开源连续扩散语言模型Cola DLM

偷瞄答案

您还未加入该AI圈子

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议