网易发布 Confucius4-TTS:业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型,3 秒音频即可克隆音色

网易有道今日发文,宣布推出“子曰 4.0”TTS 语音合成引擎 ——Confucius4-TTS。据网易有道官方介绍,Confucius4-TTS 是业内首个支持 14 种语言跨语种无口音、且无需参考文本即可完成语音克隆的开源模型。在技术性能方面,Confucius4-TTS 实现了零样本语音克隆能力。在情感表达方面,Confucius4-TTS 区别于传统 TTS 依赖文本标签控制情感的粗放方式,创新性地支持音频 Prompt 情感克隆迁移。

圈主 管理员

热门评论
:
该帖子评论已关闭
图片审查中...
编辑答案: 我的回答: 最多上传一张图片和一个附件
x
x