RolmOCR - معيار جديد للتعرف الضوئي على الحروف (OCR) مفتوح المصدر فائق السرعة عبر السيناريوهات

1. مقدمة البرنامج التعليمي
RolmOCR هي أداة OCR مفتوحة المصدر تم تطويرها بواسطة فريق Reducto AI في أبريل 2025، استنادًا إلى نموذج اللغة المرئية Qwen2.5-VL-7B. يمكنه استخراج النص من الصور وملفات PDF بسرعة وباستخدام منخفض للذاكرة، متفوقًا على الأدوات المماثلة مثل olmOCR. لا يعتمد RolmOCR على بيانات PDF، مما يسهل العملية ويدعم مجموعة واسعة من أنواع المستندات، مثل الملاحظات المكتوبة بخط اليد والأوراق الأكاديمية. يهدف فريق Reducto إلى تحسين كفاءة رقمنة المستندات من خلال تحديثات النموذج وتحسين بيانات التدريب.
يستخدم هذا البرنامج التعليمي RolmOCR كعرض توضيحي، وتستخدم الصورة vllm 0.7.3-2204، ويستخدم مورد الحوسبة RTX 4090.
2. قائمة الوظائف
- استخراج النص بسرعة: استخراج النص من الصور وملفات PDF بسرعة معالجة سريعة، ومناسبة لكميات كبيرة من المستندات.
- يدعم مجموعة متنوعة من المستندات: يمكنه التعرف على الملاحظات المكتوبة بخط اليد والمستندات المطبوعة والجداول المعقدة.
- مفتوح المصدر ومجاني: تم إصداره بموجب ترخيص Apache 2.0، ويمكن تنزيل الكود وتعديله بحرية.
- استخدام منخفض للذاكرة: فهو أكثر كفاءة في استخدام الموارد من olmOCR ولديه متطلبات كمبيوتر منخفضة عند التشغيل.
- لا حاجة إلى بيانات وصفية: اعمل مباشرة مع المستند الأصلي دون الاعتماد على معلومات إضافية من ملف PDF.
- تحسين التعرف على المستندات المائلة: يتم تدوير 15% في بيانات التدريب لتحسين القدرة على التكيف مع المستندات ذات الزوايا غير الإيجابية.
- بناءً على أحدث طراز: استخدام Qwen2.5-VL-7B لتحسين دقة التعرف وكفاءته.
3. خطوات التشغيل
1. بعد بدء تشغيل الحاوية، انقر فوق عنوان API للدخول إلى واجهة الويب
إذا تم عرض "بوابة سيئة"، فهذا يعني أن النموذج قيد التهيئة. يرجى الانتظار لمدة 1-2 دقيقة ثم قم بتحديث الصفحة.

2. العرض التوضيحي الوظيفي


معلومات الاستشهاد
شكرًا لمستخدم GitHub بويسوو لإنتاج هذا البرنامج التعليمي، معلومات مرجعية للمشروع هي كما يلي:
@misc{RolmOCR,
author = {Reducto AI},
title = {RolmOCR: A Faster, Lighter Open Source OCR Model},
year = {2025},
}
التبادل والمناقشة
🖌️ إذا رأيت مشروعًا عالي الجودة، فيرجى ترك رسالة في الخلفية للتوصية به! بالإضافة إلى ذلك، قمنا أيضًا بتأسيس مجموعة لتبادل الدروس التعليمية. مرحبًا بالأصدقاء لمسح رمز الاستجابة السريعة وإضافة [برنامج تعليمي SD] للانضمام إلى المجموعة لمناقشة المشكلات الفنية المختلفة ومشاركة نتائج التطبيق↓
