美团开源万亿参数大模型 LongCat-2.0,五万卡国产算力全流程训练

美团正式发布并宣布开源新一代基础大模型LongCat-2.0(中文名“龙猫2.0”)。官方数据显示,该模型总参数量为1.6万亿,是国内首个基于5万张国产算力卡集群完成预训练及推理全流程的大型语言模型。 相比过往行业内聚焦通用能力的发布路径,美团此次的重心主要落在底层基础设施的国产替代、模型推理成本控制,以及面向智能体与代码场景的垂直优化上。 公开资料显示,LongCat-2.0此前曾以“Owl Alpha”为代号在OpenRouter等平台进行灰度测试。在技术架构上,该模型在超过5万张国产AI芯片集群上完成了30万亿Token的预训练,并主要采用了稀疏注意力与动态激活机制。

圈主 管理员

热门评论
:
该帖子评论已关闭
图片审查中...
编辑答案: 我的回答: 最多上传一张图片和一个附件
x
x