据知情人士透露,DeepSeek 同日发布的新一代 V4 大模型,其总参数量和激活参数量,与美团 LongCat-2.0-Preview 基本一致 … 除参数规模外,美团新一代基础大模型的更大突破在于,其训练推理全程依托国产算力集群完成 … 据上述人士透露,美团本次训练阶段动用的算力卡数量在 5 万至 6 万之间,这也是迄今为止,在国产算力上完成的规模最大的大模型训练任务。
据知情人士透露,DeepSeek 同日发布的新一代 V4 大模型,其总参数量和激活参数量,与美团 LongCat-2.0-Preview 基本一致 … 除参数规模外,美团新一代基础大模型的更大突破在于,其训练推理全程依托国产算力集群完成 … 据上述人士透露,美团本次训练阶段动用的算力卡数量在 5 万至 6 万之间,这也是迄今为止,在国产算力上完成的规模最大的大模型训练任务。