AI大事件：Uber 四个月烧光2026全年AI预算，全部砸在Claude Code上

周六早上，我像往常一样打开Hacker News想看看有什么新鲜事，结果被第一条就震住了——Uber四个月烧光了2026全年的AI预算，全部用在Claude Code上。作为每天都在跟Claude Code打交道的”重度用户”，我突然觉得手里的杯子有点重。然后往下翻，又看到Apple Support App更新里居然夹带了Claude.md文件——连苹果自己都在”偷用”自家的Claude配置。科技圈这周的戏真是一出接一出，来，我带你们盘一盘。

1. Uber 四个月烧光2026全年AI预算，全部砸在Claude Code上

核心内容：Uber 的2026年AI预算在短短4个月内被完全耗尽，全部用于 Claude Code 的使用。报道显示，Uber 在 AI 编程辅助上的投入远超预期，反映出企业级 AI 工具的使用成本远高于传统软件许可模式。

点评：这条新闻最值得玩味的是——不是预算不够，而是用得太猛了。Claude Code 到底有多好用，让 Uber 这种大厂四个月干完一年的预算？这既是对 AI 编程效率的背书，也是对企业 AI 成本控制的警示。

2. Apple Support 应用更新意外夹带 Claude.md 文件

核心内容：Apple 在最新的 Apple Support 应用更新中，意外将 Claude.md 配置文件一起打包发布。这一”事故”被开发者发现后迅速在社区传播，引发了对大公司内部 AI 工具使用的广泛讨论。

点评：苹果内部工程师也在用 Claude Code，而且用得太顺手以至于忘记清理配置。这说明 Claude Code 已经成为顶级科技公司开发者的日常工具——连苹果都”真香”了。

3. Spotify 推出 “Verified” 认证徽章，区分人类艺术家与 AI 创作

核心内容：Spotify 正式推出 “Verified” 认证徽章，旨在帮助用户区分真实人类艺术家和 AI 生成音乐。该举措是应对平台上日益增长的 AI 音乐内容的第一道官方防线。

点评：当 AI 音乐多到需要”认证人类”的时候，我们对”什么是音乐”的定义已经被彻底改写了。这不仅是技术问题，更是一个文化身份问题。

4. Intel 发布 LLM 量化算法 AutoRound，开源引发关注

核心内容：Intel 开源了名为 AutoRound 的先进 LLM 量化算法，该算法能够显著降低大语言模型的部署成本和内存占用，同时保持模型性能。该项目在 Hacker News 上获得 118 个点赞。

点评：量化是 LLM 落地的关键一步。Intel 在这个领域的开源贡献让本地部署大模型变得更容易——对于不想把所有数据交给云端的企业来说，这是实打实的好消息。

5. ARC Prize 发布 GPT-5.5 与 Opus 4.7 的 ARC-AGI-3 评测分析

核心内容：ARC Prize 官方发布了 OpenAI GPT-5.5 和 Anthropic Opus 4.7 在 ARC-AGI-3 基准测试上的详细分析报告，对比了两大顶级模型在抽象推理任务上的表现差异。

点评：ARC-AGI 一直是衡量模型真正”理解能力”的试金石。GPT-5.5 和 Opus 4.7 谁更强？结果是——各有千秋，但这个距离”真正的通用智能”还有多远，数据会说话。

6. GitHub Copilot 宣布弃用 GPT-5.2 和 GPT-5.2-Codex

核心内容：GitHub 发布官方公告，宣布将逐步弃用 Copilot 中的 GPT-5.2 和 GPT-5.2-Codex 模型，推动用户迁移到更新的模型版本。

点评：大模型迭代速度之快，去年还是旗舰的 GPT-5.2，今年就在被弃用的名单上了。AI 工具的更新节奏已经远超传统软件，开发者需要适应这种”几个月换一次模型”的新常态。

7. IBM 发布 Granite 4.1 系列基础模型

核心内容：IBM 发布了 Granite 4.1 系列模型，涵盖语言模型和多种专业领域的变体，是 IBM 迄今为止规模最大的模型发布。新模型在代码生成、数学推理等任务上表现突出。

点评：IBM 一直在走”企业级 AI”路线，Granite 4.1 的目标不是跟 OpenAI 比谁的模型更”神”，而是谁在合规、安全、可控的企业场景下更靠谱。

8. Elon Musk 疑似承认 xAI 使用 OpenAI 模型进行训练

核心内容：Elon Musk 似乎在一次公开场合或社交动态中承认，其创立的 xAI 公司曾使用 OpenAI 的模型来训练自己的模型。这一表态引发了关于 AI 行业知识产权和竞争伦理的讨论。

点评：一边起诉 OpenAI 违背开源精神，一边自己拿来就用——Musk 的”双标”在科技圈早已不是新闻，但这背后的行业问题值得深思：当 AI 训练数据越来越”你中有我”，版权的边界到底在哪？

9. Show HN：AI CAD Harness —— 用 AI 重新定义 CAD 设计

核心内容：一款名为 AI CAD Harness 的开源工具在 Hacker News 上发布，将 AI 能力引入 CAD（计算机辅助设计）流程，获得 69 个点赞和大量讨论。

点评：继 AI 编程、AI 绘画之后，AI 开始向传统工程软件渗透。CAD 是制造业和建筑设计的核心工具，AI 如果能在这块硬骨头上啃下来，影响面远比写代码大得多。

10. Show HN：Loopsy —— 让不同设备的终端和 AI Agent 自由对话

核心内容：Loopsy 是一个开源工具，能够在不同机器上的终端和 AI Agent 之间建立通信通道。解决了分布式 AI Agent 之间”语言不通”的问题，获得 45 个点赞。

点评：Agent 之间的互操作性正在成为基础设施级别的需求。Loopsy 解决的正是”我的 Agent 在你的机器上怎么跑”这个让每个开发者都头疼的问题。

11. Tangled —— 通过构建信任网络对抗 LLM 垃圾信息

核心内容：一个新项目 Tangled 希望通过构建”信任网络”来对抗日益泛滥的 LLM 生成的垃圾信息和虚假内容。该项目在 Hacker News 上获得 7 个点赞。

点评：AI 生成内容的井喷已经让互联网的信息质量急剧下降。”信任网络”的思路好比给互联网装上社交信用分，听起来不错，但谁来当裁判是个更难的问题。

12. Claude Opus 4.7 在 AWS Bedrock 上配额突然归零

核心内容：多位用户在 Hacker News 上反映，Claude Opus 4.7 在 AWS Bedrock 上的 TPM（每分钟令牌数）配额突然被重置为 0，导致无法使用。Anthropic 尚未对此作出官方回应。

点评：API 配额突然归零对依赖该模型的生产环境是致命打击。这让越来越多团队开始思考——是不是该备一个”模型冗余”策略？

13. GPT-5.5 vs GPT-5.4 vs Opus 4.7：56个真实编码任务实测对比

核心内容：一位开发者从两个开源仓库中提取了 56 个真实编码任务，对 GPT-5.5、GPT-5.4 和 Opus 4.7 三款模型进行了横向对比测试，结果各有胜负。

点评：真实编码任务才是最靠谱的评判标准。评测结果显示，虽然新版本在持续进步，但”哪家更强”依然没有定论——最好的策略可能是保持模型中立。

14. AI 耗水量远低于公众想象

核心内容：一项新研究指出，AI 数据中心的实际耗水量远低于公众普遍认为的水平。研究呼吁公众理性看待 AI 的环境影响，不要被夸大的数字误导。

点评：AI 的能耗和环保问题一直被舆论放大。真实数据摆出来后，事情并没有那么悲观——但”没那么糟糕”不等于”没问题”，合理的监管和效率提升依然重要。

15. “The LLM Is Not a Junior Engineer” —— 关于 LLM 编码能力的反思

核心内容：一篇热帖提出”LLM 不是初级工程师”的论点，认为将 LLM 定位为”初级程序员”是对 LLM 能力和局限性的双重误判。文章引发了关于如何正确使用 AI 编码工具的热烈讨论。

点评：把 LLM 当成初级工程师来用，既低估了它的能力（在某些领域的表现远超初级），也高估了它的可靠性（它会自信地犯错）。正确的姿势应该是——把它当成一个”超级实习生”。

{{userData.name}}已认证

AI大事件：Uber 四个月烧光2026全年AI预算，全部砸在Claude Code上

1. Uber 四个月烧光2026全年AI预算，全部砸在Claude Code上

2. Apple Support 应用更新意外夹带 Claude.md 文件

3. Spotify 推出 “Verified” 认证徽章，区分人类艺术家与 AI 创作

4. Intel 发布 LLM 量化算法 AutoRound，开源引发关注

5. ARC Prize 发布 GPT-5.5 与 Opus 4.7 的 ARC-AGI-3 评测分析

6. GitHub Copilot 宣布弃用 GPT-5.2 和 GPT-5.2-Codex

7. IBM 发布 Granite 4.1 系列基础模型

8. Elon Musk 疑似承认 xAI 使用 OpenAI 模型进行训练

9. Show HN：AI CAD Harness —— 用 AI 重新定义 CAD 设计

10. Show HN：Loopsy —— 让不同设备的终端和 AI Agent 自由对话

11. Tangled —— 通过构建信任网络对抗 LLM 垃圾信息

12. Claude Opus 4.7 在 AWS Bedrock 上配额突然归零

13. GPT-5.5 vs GPT-5.4 vs Opus 4.7：56个真实编码任务实测对比

14. AI 耗水量远低于公众想象

15. “The LLM Is Not a Junior Engineer” —— 关于 LLM 编码能力的反思

AI大事件：谷歌、微软、亚马逊、Meta四大科技巨头财报同日公布；9所高校获批开设具身智能本科专业

OpenClaw本地电脑部署教程和价值盘点（手把手教程）

AI大事件：Uber 四个月烧光2026全年AI预算，全部砸在Claude Code上

Manus 深度评测：全球首款通用型 Agent，到底能不能真干活？

WorkBuddy 深度测评：能替打工人省多少事？

GPT Image 2 深度评测：AI 生图终于学会写中文了

Claude Opus 4.7 深度评测：最强编程模型，也逃不过翻车命运

World Model（世界模型）：AI开始有”想象力”了

Kimi K2.6 实测：能干 13 小时活的代码 Agent

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议