这款代号为”GLM-5.1-highspeed”的模型一经发布便震撼业界,其输出速度成功达到了惊人的 400 tokens/s … 这一数据直接刷新了当前全球大模型厂商的 API 速度上限,展现出极强的技术统治力 … 在过去的人工智能行业认知中,模型的运行速度与体积往往不可兼得,高速度通常意味着需要牺牲模型的能力。
这款代号为”GLM-5.1-highspeed”的模型一经发布便震撼业界,其输出速度成功达到了惊人的 400 tokens/s … 这一数据直接刷新了当前全球大模型厂商的 API 速度上限,展现出极强的技术统治力 … 在过去的人工智能行业认知中,模型的运行速度与体积往往不可兼得,高速度通常意味着需要牺牲模型的能力。