HyperAIHyperAI

Command Palette

Search for a command to run...

DAN: شبكة انتباه وثائق بدون تقسيم للاعتراف بالوثائق المكتوبة بخط اليد

Denis Coquenet Clément Chatelain Thierry Paquet

الملخص

التعرف على النص اليدوي غير المقيد هو مهمة صعبة في مجال رؤية الحاسوب. وقد كان يُعالج تقليديًا باستخدام نهج ذو خطوتين، يجمع بين تقسيم السطور وتعرف النص في السطور. وللمرة الأولى، نقترح هندسة معمارية شاملة وبدون تقسيم للتعامل مع مهمة التعرف على الوثائق اليدوية: شبكة الانتباه للوثائق (Document Attention Network). بالإضافة إلى التعرف على النص، يتم تدريب النموذج لتسمية أجزاء النص باستخدام علامات بداية ونهاية بطريقة مشابهة لـ XML. يتكون هذا النموذج من مُشفِّر FCN لاستخراج الميزات ومكدس من طبقات فك التشفير الخاصة بالمتغير (Transformer) لأداء عملية التنبؤ المتكررة حرفًا حرفًا. يأخذ النموذج مستندات النص الكامل كمدخل ويخرج الأحرف بشكل متتابع، بالإضافة إلى رموز التنسيق المنطقي. بخلاف الأساليب القائمة على التقسيم الموجودة حاليًا، يتم تدريب هذا النموذج بدون استخدام أي علامة تقسيم. نحقق نتائج تنافسية على مجموعة بيانات READ 2016 عند مستوى الصفحة وكذلك عند مستوى الصفحتين بخطأ معدل الأحرف (CER) بنسبة 3.43% و3.70% على التوالي. كما نقدم أيضًا نتائج لمجموعة بيانات RIMES 2009 عند مستوى الصفحة، حيث يصل معدل خطأ الأحرف (CER) إلى 4.54%. نوفر جميع الكود المصدر وأوزان النماذج المدربة مسبقًا في الرابط التالي:https://github.com/FactoDeepLearning/DAN.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp