-
AI大事件:苹果与OpenAI合作关系破裂/xAI发布首款Coding Agent/Gemini 3.5 Pro首曝,编程能力追平GPT-5.5
AI工具之间的"黏性"越来越强了,以前是各玩各的,现在都在抢"工作台"这个入口。今天这几条新闻看下来,这个感觉更明显了:阿里把Qoder从IDE升级成Agent工作台,xAI直接出了Coding Agent,连腾讯云都在做Agent记忆管理。另一边,具身智能那边Figure 03的直播有点东西,真的在跑没人管。今天这15条,信息量不小,逐条看。 1. Cer…- 1.9k
- 0
-
Multimodal(多模态):AI终于能”看见”和”听见”了
一个有意思的时间线: 2020年:AI能看图,但只能看图 2022年:AI能听语音,但只能听语音 2023年:AI能同时看图、听语音、读文字——而且能一起理解 这个"既能看又能听还能读"的能力,叫做Multimodal(多模态)。 一句话理解 多模态(Multimodal) = 让AI同时拥有人类感知世界的多种方式——看图、听声音、读文字,并且能把这些不同类型的信息联合起来理解…- 769
- 0
-
Gemini评测:Google AI旗舰产品,全能AI王者
📌 导语:当Google全力押注AI,Gemini就是它的答案。凭借7.5亿月活用户、100万token超长上下文和最强多模态能力,Gemini正在快速蚕食ChatGPT的市场份额。 Gemini是Google推出的多模态AI助手,支持文本、图像、音频和视频处理,拥有7.5亿月活用户和20亿搜索AI概览用户。其核心优势在于100万token超长上下文、最强图像理解和与Google生态的深度整合,特…- 39
- 0
-
Vibe Coding过时了?谷歌开始卷Vibe Searching
谷歌发布Gemini Embedding 2模型,标志着AI从“Vibe Coding”迈向“Vibe Searching”新时代。该模型首次将文本、图像、视频、音频及文档五种模态原生映射至同一语义空间,打破数据孤岛,实现跨模态精准检索。 ———— / BEGIN / ———— AI能根据你的文字生成图片,也能生成视频。 可当我们人类想要的东西是一段画面、一种氛围、一个模糊的印象,机器就没啥办法了…- 316
- 0
-
一手实测Nano Banana 2,我总结了8大新玩法
大家好,我是冷逸。 最近,AI圈有三大奇观:养龙虾🦞,等种子🌾,玩香蕉🍌。 而前几天,「香蕉2」正式发布了,官方名字Gemini 3.1 Flash Image。 一看这个名字,你就能明白,谷歌这是把Nano Banana的能力 + Flash的速度,直接合体了。 我们的老朋友lovart.ai,也第一时间接入了🍌2,付费会员依旧0积分体验。 先给大家简单做一个总结: 1)🍌2整体性能和Pro差距…- 2.6k
- 0









