全部标签

视频生成

Multimodal（多模态）：AI终于能”看见”和”听见”了

一个有意思的时间线： 2020年：AI能看图，但只能看图 2022年：AI能听语音，但只能听语音 2023年：AI能同时看图、听语音、读文字——而且能一起理解这个"既能看又能听还能读"的能力，叫做Multimodal（多模态）。一句话理解多模态（Multimodal） = 让AI同时拥有人类感知世界的多种方式——看图、听声音、读文字，并且能把这些不同类型的信息联合起来理解…
AI百科
- 781
- 0
花花🌸环游世界4月25日
LibTV测评：上线首日涌入10万创作者，这款AI视频工具到底值不值？

说起来，你是不是也见过那种"AI生成视频"的宣传，点一下，出来一段还算流畅的画面，但离"专业"还差十万八千里。画面跳、角色崩、逻辑乱，想改？改不了，要么重来。LibTV就是在解决这个问题。不是简单的"生成一段视频"，而是把剧本→分镜→画面→成片的完整链条，全部交给创作者自己掌控。上线首日就涌入了10万创作者和AI智能体，这个数字本身就说明…
AI工具
- 211
- 0
强哥来了4月15日