HyperAI超神经

1 天前

百度飞桨团队近日正式推出PaddleOCR最新一代通用模型家族PP-OCRv6，该模型已同步上线Hugging Face Hub。PP-OCRv6面向文档、多语言图片及工业标签等复杂场景，提供150万至3450万参数量的三档轻量级架构，其中Small与Medium版本实现单模型支持50种语言。基准测试显示，Medium版本文本检测Hmean达86.2%，识别准确率达83.2%，较上一代Server版检测精度提升4.6个百分点，识别精度提升5.1个百分点。为兼顾精度与部署效率，PP-OCRv6采用PPLCNetV4作为检测与识别的统一骨干网络，引入RepLKFPN大感受野特征金字塔强化多尺度文本定位，识别端结合EncoderWithLightSVTR结构优化复杂背景下的字符解析。工程方面，该模型全面兼容PaddleOCR 3.7框架，原生支持Paddle Inference、Hugging Face Transformers及ONNX Runtime等多种推理后端，开发者可依据边缘、移动或服务器环境灵活配置。此次发布进一步夯实了飞桨在垂直OCR领域的技术优势，为文档解析、大模型检索增强及自动化工作流提供了高效、低成本的工业级落地方案。

此资讯由 AI 智能聚合生成，旨在高效传递行业动态，不代表任何观点或建议。

相关链接

相关链接

相关链接

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征

Command Palette

PP-OCRv6上线Hugging Face：支持50语种，参数量150万至3450万

相关链接

Command Palette

PP-OCRv6上线Hugging Face：支持50语种，参数量150万至3450万

相关链接

Command Palette

PP-OCRv6上线Hugging Face：支持50语种，参数量150万至3450万

相关链接

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征

材料 AI 迈向「可解释时代」，日本团队破解高维光谱黑箱，锁定新材料发现关键特征