当工程师拒绝更聪明的模型:AI 推理大战,OpenAI 换了一把「枪」

这笔交易的核心逻辑在于:OpenAI 旗下 GPT-5.3-Codex-Spark 模型在 Cerebras 硬件上可实现每用户每秒 2000 个 token 的生成速度,远超基于 HBM 的 GPU 集群所能提供的交互体验 … 更具说服力的是,当 Opus 4.7 发布时,团队中多名工程师拒绝升级,原因仅仅是新版本不支持快速模式 … 根据 SemiAnalysis 援引的 S-1 文件,双方于 2025 年 12 月签署主关系协议(MRA),OpenAI 承诺在 2026 至 2028 年间分批采购 750 兆瓦 AI 推理算力,每批次合同期 3 至 4 年,可延长至 5 年,并持有额外采购 1.25 吉瓦的选择权。

原文连接