当工程师拒绝更聪明的模型：AI 推理大战，OpenAI 换了一把「枪」

AI
5月18日

强哥来了

这笔交易的核心逻辑在于：OpenAI 旗下 GPT-5.3-Codex-Spark 模型在 Cerebras 硬件上可实现每用户每秒 2000 个 token 的生成速度，远超基于 HBM 的 GPU 集群所能提供的交互体验 … 更具说服力的是，当 Opus 4.7 发布时，团队中多名工程师拒绝升级，原因仅仅是新版本不支持快速模式 … 根据 SemiAnalysis 援引的 S-1 文件，双方于 2025 年 12 月签署主关系协议（MRA），OpenAI 承诺在 2026 至 2028 年间分批采购 750 兆瓦 AI 推理算力，每批次合同期 3 至 4 年，可延长至 5 年，并持有额外采购 1.25 吉瓦的选择权。

原文连接

{{userData.name}}已认证

当工程师拒绝更聪明的模型：AI 推理大战，OpenAI 换了一把「枪」

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议

{{userData.name}}已认证

相似站点

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议