PP-OCRv6上线Hugging Face:支持50语种,参数量150万至3450万
百度飞桨团队近日正式推出PaddleOCR最新一代通用模型家族PP-OCRv6,该模型已同步上线Hugging Face Hub。PP-OCRv6面向文档、多语言图片及工业标签等复杂场景,提供150万至3450万参数量的三档轻量级架构,其中Small与Medium版本实现单模型支持50种语言。基准测试显示,Medium版本文本检测Hmean达86.2%,识别准确率达83.2%,较上一代Server版检测精度提升4.6个百分点,识别精度提升5.1个百分点。为兼顾精度与部署效率,PP-OCRv6采用PPLCNetV4作为检测与识别的统一骨干网络,引入RepLKFPN大感受野特征金字塔强化多尺度文本定位,识别端结合EncoderWithLightSVTR结构优化复杂背景下的字符解析。工程方面,该模型全面兼容PaddleOCR 3.7框架,原生支持Paddle Inference、Hugging Face Transformers及ONNX Runtime等多种推理后端,开发者可依据边缘、移动或服务器环境灵活配置。此次发布进一步夯实了飞桨在垂直OCR领域的技术优势,为文档解析、大模型检索增强及自动化工作流提供了高效、低成本的工业级落地方案。
