重磅！MiniMax M3 即将发布：稀疏注意力架构突破，百万 Token 上下文效率暴增

AI
5月27日

强哥来了

M3 采用了全新稀疏注意力（Sparse Attention）架构，通过 Index Branch 快速索引与 Sparse Branch 精准计算相结合的方式，有效解决了超长上下文场景下的计算瓶颈 … 稀疏注意力等技术的突破，有望推动大模型从”参数规模竞赛”转向”效率与实用性竞赛”，为企业级落地和消费者应用带来更实惠、高效的体验 … 目前 MiniMax 尚未公布 M3 的具体发布时间与完整参数规模，但从工程负责人的预告及性能数据来看，这款模型有望成为长上下文处理领域的有力竞争者。

原文连接

{{userData.name}}已认证

重磅！MiniMax M3 即将发布：稀疏注意力架构突破，百万 Token 上下文效率暴增

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议

{{userData.name}}已认证

相似站点

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议