阿里巴巴发布图像生成与编辑统一模型 Wan2.7-Image,宣布针对当前 AI 生图领域「标准脸」审美疲劳和「色彩盲盒」等痛点,进一步实现「千人千面」捏出「活人感」,更可精准控制色彩 … 在人类偏好盲测中,「文生图」能力超过 GPT-Image1.5 和国内主流模型,在文本渲染、照片级成像和世界知识指标上,接近 Nano Banana Pro … 针对超长文字渲染容易文字模糊、内容错乱甚至直接漏写等的 AI 生图痛点,Wan2.7-Image 凭借长上下文文本编码(Long Context Text Encoder)解析超长序列,对超长文字、表格和复杂公式的渲染可达印刷级,支持 12 种语言,最高 3K tokens 的超长文字输入,可输出一页 A4 纸的论文。
暂无讨论,说说你的看法吧

