-
Multimodal(多模态):AI终于能”看见”和”听见”了
一个有意思的时间线: 2020年:AI能看图,但只能看图 2022年:AI能听语音,但只能听语音 2023年:AI能同时看图、听语音、读文字——而且能一起理解 这个"既能看又能听还能读"的能力,叫做Multimodal(多模态)。 一句话理解 多模态(Multimodal) = 让AI同时拥有人类感知世界的多种方式——看图、听声音、读文字,并且能把这些不同类型的信息联合起来理解…- 714
- 0
-
LibTV测评:上线首日涌入10万创作者,这款AI视频工具到底值不值?
说起来,你是不是也见过那种"AI生成视频"的宣传,点一下,出来一段还算流畅的画面,但离"专业"还差十万八千里。画面跳、角色崩、逻辑乱,想改?改不了,要么重来。LibTV就是在解决这个问题。不是简单的"生成一段视频",而是把剧本→分镜→画面→成片的完整链条,全部交给创作者自己掌控。上线首日就涌入了10万创作者和AI智能体,这个数字本身就说明…- 109
- 0




