全部标签

MoE架构

Qwen3.5 评测：从 0.8B 到 397B，开源大模型的代际突围

用 3B 的活跃参数跑出超越前代 235B 的性能，就这一条，Qwen3.5 已经让整个开源社区炸了锅。从 0.8B 的物联网小模型到 397B 的 MoE 旗舰，覆盖十条产品线，Apache 2.0 全开源商用无限制。但它真的像参数上看起来那么香吗？上手测了一圈，效率提升确实惊人，工具调用和 Agent 能力却还有进步空间。先搞懂它是什么 2026 年除夕夜，阿里通义千问放了个大招，一口气甩出…
AI工具
- 98
- 0
迎风尿尿尿不湿5月6日
MiMo-V2.5 评测：小米的 310B 全模态 Agent 到底猛不猛

写代码到一半突然要切去调音频、看文档、分析视频，一个模型搞定所有模态，这事以前是奢望。小米 MiMo-V2.5 系列，310B MoE 架构、1M 上下文、全系开源，Pro 版在 SWE-bench Pro 上跑到 57.2%。实测用它接 Claude Code 写了一套公众号数据分析平台，一次部署成功。API 价格比 Claude 便宜六成，V2.5 版本每百万 token 输入才 7 块钱。到…
AI工具
- 135
- 0
强哥来了4月30日