Multimodal(多模态):AI终于能”看见”和”听见”了 一个有意思的时间线: 2020年:AI能看图,但只能看图 2022年:AI能听语音,但只能听语音 2023年:AI能同时看图、听语音、读文字——而且能一起理解 这个"既能看又能听还能读"的能力,叫做Multimodal(… 赞 参与讨论{{item.data.meta.comment}}条讨论
Multimodal(多模态):AI终于能”看见”和”听见”了 一个有意思的时间线: 2020年:AI能看图,但只能看图 2022年:AI能听语音,但只能听语音 2023年:AI能同时看图、听语音、读文字——而且能一起理解 这个"既能看又能听还能读"的能力,叫做Multimodal(… 赞 参与讨论{{item.data.meta.comment}}条讨论
作者: Multimodal(多模态):AI终于能”看见”和”听见”了 一个有意思的时间线: 2020年:AI能看图,但只能看图 2022年:AI能听语音,但只能听语音 2023年:AI能同时看图、听语音、读文字——而且能一起理解 这个"既能看又能听还能读"的能力,叫做Multimodal(… 赞 参与讨论{{item.data.meta.comment}}条讨论
Multimodal(多模态):AI终于能”看见”和”听见”了 一个有意思的时间线: 2020年:AI能看图,但只能看图 2022年:AI能听语音,但只能听语音 2023年:AI能同时看图、听语音、读文字——而且能一起理解 这个"既能看又能听还能读"的能力,叫做Multimodal(… 赞 参与讨论{{item.data.meta.comment}}条讨论