HyperAIHyperAI

Command Palette

Search for a command to run...

百度开源Unlimited-OCR:支持单次长跨度文档解析

近日,百度正式开源视觉文档解析模型Unlimited-OCR,致力于推动一次性长视野解析技术的落地。针对传统光学字符识别在长文本处理中的效率与精度瓶颈,该模型通过架构优化实现了高精度内容提取。Unlimited-OCR原生支持单图与多页长文档解析,并内置PDF直读与批量处理功能。为适配不同算力环境,项目同步开放基于HuggingFace Transformers的轻量化推理接口与基于SGLang的高并发服务端方案,开发者可灵活配置图像尺寸与截断策略。该开源项目大幅降低了长文档智能解析的技术门槛,为政务、金融及出版等行业的数字化归档提供了高效底层支持。百度联合多家技术团队完成核心攻坚,相关代码已全面托管至开源社区,标志着文档智能处理向长上下文理解迈进重要一步。

相关链接