英伟达开源 TwoTower AI 模型：保留 98.7% 质量，Token 生成提速 2.42 倍

AI
7月03日

强哥来了

英伟达昨日（7 月 2 日）发布博文，宣布推出 Nemotron-Labs-TwoTower，是一种基于预训练自回归骨干网络的离散扩散语言模型，致力于解决大模型 Token 生成速度瓶颈 … 参数方面，该模型总参数为 60B，采用双塔（TwoTower）架构，包括 30B 的自回归模型（AR）/context Tower 和 30B 的扩散 / 降噪 Tower，每个 Tower 激活 3B 模型，128 个可路由专家 … 性能方面，英伟达表示从综合基准测试质量来看，双塔架构保留 98.7% 的质量表现，但是实际运行时间吞吐量提高了 2.42 倍。

原文连接

{{userData.name}}已认证

英伟达开源 TwoTower AI 模型：保留 98.7% 质量，Token 生成提速 2.42 倍

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议