美团发布原生多模态 LongCat-Next:当视觉和语音成为 AI 的母语

今天的大模型,本质上仍然是以语言为中心的建模系统,语言作为人类智慧符号化表述,在「压缩即智能」的范式下表现出强大的能力 … 视觉、语音与文本等多模态信号,实际上是对现实物理对象的不同侧面投影。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧