刚刚,智谱发布 GLM-5V-Turbo:任意图像,皆为代码!

我们发布 GLM-5V-Turbo,面向视觉编程打造的多模态 Coding 基座模型 … 在纯文本 Coding 能力方面,GLM-5V-Turbo 在 CC-Bench-V2 的 Backend、Frontend 和 Repo Exploration 三项核心基准测试中均保持稳定表现,表明视觉能力引入后,纯文本编程与推理能力保持了同等水准 …-多模态工具链扩展:在文本工具基础上,GLM-5V-Turbo 新增支持多模态搜索、画框、截图、读网页等多模态 tools,将编程与任务执行的感知-行动链路从纯文本扩展到视觉交互。

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧