-
Spatial-TTT:流式空间智能的另一条路,不是更长的窗口而是更聪明的记忆
过去一年,长视频理解的主流思路几乎是一个共识:把上下文窗口拉长。从 32 帧到 128 帧再到上千帧,大家比的是谁能往模型里塞进更多的画面。Spatial-TTT 这篇论文一上来就把这个共识掀了:核心挑战根本不是窗口够不够长,而是空间信息怎么被选择、组织和保留。 换句话说,你给模型看一段两小时的房间漫游视频,真正的难题不是它能不能"记住"这么多帧,而是它能不能把"沙发…- 1k
- 0
-
Grok 深度评测:马斯克的AI野心,值得你花 $30/月吗?
摘要: Grok 是 X AI 推出的 AI 助手,深度绑定 X 平台实时数据,支持 2M 超长上下文、多模态输入及 Big Brain 深度推理。免费版每2小时10次,SuperGrok $30/月无限使用。最适合重度 X 用户和需要实时信息的内容创作者。 最近我一直在观察一个问题:为什么 Grok 这个产品,会让很多人同时觉得"很厉害"又觉得"用不上"?…- 707
- 0




