而模型蒸馏,不需要从零开始搭建模型架构、不需要投入巨资做全量预训练,只需要通过 API 接口,向这些头部模型发起海量合规或非常规的请求,收集模型的输出逻辑、推理路径、答案分布、思维链等核心信息,再用这些数据反向训练自己的模型 … 在行业普遍追求快速落地、靠蒸馏追赶海外技术时,智谱把核心精力放在了基座模型研发、学术技术突破和企业级合规落地,即便在模型能力初期不及蒸馏模型,也始终坚持自主迭代 … 此前美国 AI 公司 Anthropic 发布的行业报告中,就公开指控多家中国大模型公司,通过大规模非常规手段实施「工业级蒸馏」,其中深度求索(DeepSeek)、MiniMax 的争议最为典型,也直接印证了国内部分公司对海外模型的高度依赖。
暂无讨论,说说你的看法吧

