云知声Unisound U1-OCR大模型

云知声发布首个工业级文档智能基础大模型 Unisound U1-OCR,实现从 OCR 2.0 到 3.0 的跨越。该模型采用 ViT+LLM 架构,搭载 NaViT 架构实现分辨率动态处理,3B 量级参数兼顾效率与语义理解能力。其首创“语义驱动+动态聚焦”策略,强化空间对齐模块,提升长文档逻辑连贯性,推理效率提升 80% 以上。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧