这些模型的特别之处在于,某一款仅需激活 3.8 亿个参数,便能在权威榜单上超越体量是其 20 倍的其他大型模型 … Gemma4 系列包含多个尺寸的模型,具体包括有效参数量为 2.3B 的 gemma-4-E2B、4.5B 的 gemma-4-E4B、26B 参数的混合专家模型以及 31B 参数的稠密模型 … 31B 参数的稠密模型在竞技场人工智能的文本排行榜中位列全球开源模型的第三名,而 26B 参数的混合专家模型也取得了第六名的好成绩。
暂无讨论,说说你的看法吧
这些模型的特别之处在于,某一款仅需激活 3.8 亿个参数,便能在权威榜单上超越体量是其 20 倍的其他大型模型 … Gemma4 系列包含多个尺寸的模型,具体包括有效参数量为 2.3B 的 gemma-4-E2B、4.5B 的 gemma-4-E4B、26B 参数的混合专家模型以及 31B 参数的稠密模型 … 31B 参数的稠密模型在竞技场人工智能的文本排行榜中位列全球开源模型的第三名,而 26B 参数的混合专家模型也取得了第六名的好成绩。