HyperAIHyperAI

Command Palette

Search for a command to run...

يطلق PP-OCRv6 التعرف الضوئي لـ 50 لغة على Hugging Face

أعلنت منصة PaddlePaddle التابعة لشركة بايدو عن إطلاق الجيل السادس من نماذج التعرف الضوئي على الحروف PP-OCRv6، والمُتاح مباشرة عبر Hugging Face. يُمثل هذا الإصدار تطوراً تقنياً يهدف إلى تقديم حلول OCR خفيفة الوزن وعالية الدقة للتعامل مع النصوص في بيئات العالم الحقيقي، بما في ذلك المستندات، واللقطات الرقمية، واللافتات الصناعية، والعناصر المعقدة. تتنوع العائلة النموذجية بين ثلاث طبقات تتراوح معاملاتها بين 1.5 مليون و34.5 مليون معامل، مصممة لتلبي متطلبات الحوسبة من الأجهزة الطرفية محدودة الموارد إلى الخوادم المركزية. حقق النموذج من الطراز Medium دقة 86.2% في كشف النصوص و83.2% في التعرف عليها، مسجلاً تحسناً ملحوظاً بنسب 4.6 و5.1 نقطة مقارنة بالإصدار السابق PP-OCRv5_server. يدعم النموذجان Small وMedium مجموعة موحدة من 50 لغة، تشمل الصينية والإنجليزية واليابانية و46 لغة لاتينية، مما يلغي الحاجة إلى إدارة نماذج متعددة في السيناريوهات متعددة اللغات. يعتمد الهيكل المعماري الموحد على العمود الفقري PPLCNetV4، مع تعزيز خوارزمية الكشف بـ RepLKFPN للاستخراج الدقيق للنصوص متعددة المقاسات، واستخدام EncoderWithLightSVTR لتحسين التعرف على النصوص الضبابية أو المشوهة. يركز الإصدار على المرونة التشغيلية والدمج السلس، حيث توفر مكتبة PaddleOCR واجهة استدعاء موحدة تتيح اختيار بيئات الاستدعاء المناسبة بما في ذلك Paddle Inference الافتراضي، وTransformers للمطورين، وONNX Runtime للبيئات المحمولة. يتوفر النموذج بصيغ متعددة على Hugging Face، بما فيها Safetensors، مما يسهل استخدامه في أنظمة استخراج البيانات، والبحث الذكي، والتكامل مع النماذج اللغوية الكبيرة وأدوات الأتمتة. يتاح للمستخدمون تجربة الأداء مباشرة عبر بيئة تجريبية مستضافة، مع وثائق تنفيذية دقيقة تضمن تبسيط سير العمل البرمجي وتأكيد كفاءة الحل كبديل متخصص وفائق الكفاءة في عصر النماذج اللغوية الضخمة.

الروابط ذات الصلة