美国 AI 三巨头围剿模型蒸馏，中国公司终要大考

行业动态
4月07日

AI观察者AI行业观察者

而模型蒸馏，不需要从零开始搭建模型架构、不需要投入巨资做全量预训练，只需要通过 API 接口，向这些头部模型发起海量合规或非常规的请求，收集模型的输出逻辑、推理路径、答案分布、思维链等核心信息，再用这些数据反向训练自己的模型 … 在行业普遍追求快速落地、靠蒸馏追赶海外技术时，智谱把核心精力放在了基座模型研发、学术技术突破和企业级合规落地，即便在模型能力初期不及蒸馏模型，也始终坚持自主迭代 … 此前美国 AI 公司 Anthropic 发布的行业报告中，就公开指控多家中国大模型公司，通过大规模非常规手段实施「工业级蒸馏」，其中深度求索（DeepSeek）、MiniMax 的争议最为典型，也直接印证了国内部分公司对海外模型的高度依赖。

原文连接

{{userData.name}}已认证

美国 AI 三巨头围剿模型蒸馏，中国公司终要大考

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议