百度开源 Unlimited OCR 模型：基于 DeepSeek OCR，解析文档告别 AI 越生成越慢

2026-6-25 17:56:28

百度于 6 月 22 日开源推出 Unlimited OCR 模型，总参数量 30 亿，推理时仅激活 5 亿参数，目标解决在解析长文档时，端到端 OCR 模型越生成越慢的问题。 IT之家注：端到端 OCR 模型是统一神经网络架构系统，融合检测图像中的文本和字符识别，摒弃了传统“先检测文字框、再单独识别”的繁琐流程，直接从输入图像映射到文本序列输出，从而减少信息丢失和计算冗余。主流端到端 OCR 模型每生成 1 个 token，都会扩大 KV cache（键值缓存），显存占用和延迟随之上升，导致在用户的感知中，AI 解析多页文档后越生成越慢。

圈主管理员

热门评论

该帖子评论已关闭

图片审查中...

编辑答案：我的回答：最多上传一张图片和一个附件

表情

图片

附件

取消编辑

{{userData.name}}已认证

百度开源 Unlimited OCR 模型：基于 DeepSeek OCR，解析文档告别 AI 越生成越慢

偷瞄答案

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议

{{userData.name}}已认证

百度开源 Unlimited OCR 模型：基于 DeepSeek OCR，解析文档告别 AI 越生成越慢

偷瞄答案

您还未加入该AI圈子

相似站点

Ardot

阿里悟空

QClaw

关于我们

商务合作

隐私声明

用户协议