منذ 2 أشهر
الترقيم العميق: التكرار الهرمي الفعال لتحسين الترقيم العربي
Badr AlKhamissi; Muhammad N. ElNokrashy; Mohamed Gabr

الملخص
نقترح معمارية جديدة لتصنيف تسلسلات الحروف تحقق نتائج رائدة على معيار التشكيل للغة العربية (Tashkeela). يشكل جوهر هذه المعمارية هرمية متكررة ذات مستويين تعمل على مستوى الكلمة ومستوى الحرف بشكل منفصل، مما يمكّن من التدريب والاستدلال أسرع من النماذج التقليدية المماثلة. يربط الوحدة الانتباهية بين المستويين، ويفتح الباب أمام قابلية فهم الشبكة. يتكون وحدة المهمة من تصنيف softmax يقوم بحصورة جميع التركيبات الصحيحة للتشكيل. يمكن توسيع هذه المعمارية بإضافة محكّم متكرر اختياريًا يستقبل معلومات أولية من النصوص شبه المشكّلة، مما يحسن النتائج. نستخدم تقنيات إضافية مثل إسقاط الجمل والتصويت بالأغلبية لتعزيز النتيجة النهائية بشكل أكبر. حقق أفضل نموذج لدينا معدل خطأ لكلمات (WER) بنسبة 5.34٪، مما يتفوق على أفضل ما سبقه بمعدل خفض نسبة الخطأ النسبي 30.56٪.