子曰 4″ 正式迈入全模态时代,不仅全面支持文本、图片、音频的融合交互,有道更宣布将核心的”多模态模型”与”语音合成(TTS)模型”正式开源 … 开源的”子曰 4″多模态模型在 27B 参数规模上,面向教育场景,将支持视觉输入的数理能力拉到了行业顶尖水平(SOTA) … 此次与多模态模型一同开源的还有语音合成(TTS)引擎 ,该引擎基于前沿的”语音编码器 +LLM”架构打造,面向开发者及内容创作者提供零样本、低门槛的语音克隆与情感合成能力。
子曰 4″ 正式迈入全模态时代,不仅全面支持文本、图片、音频的融合交互,有道更宣布将核心的”多模态模型”与”语音合成(TTS)模型”正式开源 … 开源的”子曰 4″多模态模型在 27B 参数规模上,面向教育场景,将支持视觉输入的数理能力拉到了行业顶尖水平(SOTA) … 此次与多模态模型一同开源的还有语音合成(TTS)引擎 ,该引擎基于前沿的”语音编码器 +LLM”架构打造,面向开发者及内容创作者提供零样本、低门槛的语音克隆与情感合成能力。