清华联合腾讯混元斩获 MLSys2026MoE 推理挑战赛冠军,NPU 推理提速 4.1 倍

清华大学存储实验室与腾讯混元 AI Infra 团队近日联合宣布,在国际机器学习系统顶级会议 MLSys2026 举办的 MoE 模型推理优化挑战赛中荣获全球冠军 … 面对万亿参数时代混合专家(MoE)架构在异构芯片 (NPU) 上的推理性能瓶颈,联合团队针对官方指定模型及 NPU 硬件设计了全链路优化方案 … 在此次角逐中,团队还联合研发了基于 Agent 的推理算子优化器”Knight”,通过方案提出、代码落地与复盘迭代的自动化闭环,大幅拓展了优化搜索空间。

原文连接