不用人类手写训练框架了!AI自己写代码,训出1B端侧「小钢炮」

这听起来像是一个轻量、有趣的 AI「桌宠」场景,但背后其实对应着大模型行业正在发生的一次路线分化。过去很长一段时间,大模型给人的印象都是庞然大物:数百亿甚至上千亿参数起步,推理依赖云端数据中心,背后是高昂的算力、电力和调用成本。更特别的是,MiniCPM5-1B 背后还「站着」 ForgeTrain,全球首个完全由 AI 编写的生产级大模型训练框架,训练效果与英伟达 Megatron 对齐,训练速度比后者快 10%,相当于同等算力下成本降低 10%。

圈主 管理员

热门评论
:
该帖子评论已关闭
图片审查中...
编辑答案: 我的回答: 最多上传一张图片和一个附件
x
x