منذ 2 أشهر
Mask R-CNN مع شبكة الانتباه الهرمية لاكتشاف النص في المشهد
Huang, Zhida ; Zhong, Zhuoyao ; Sun, Lei ; Huo, Qiang

الملخص
في هذا البحث، نقدم نهجًا جديدًا للكشف عن النصوص يستند إلى Mask R-CNNويمكنه الكشف بثبات عن النصوص متعددة الاتجاهات والمنحنية من صور المشاهد الطبيعية بطريقة موحدة.لتحسين قدرة تمثيل الميزات في Mask R-CNN للمهام المتعلقة بالكشف عن النصوص، نقترح استخدام شبكة الانتباه الهرمية (PAN)كمكون أساسي جديد لـ Mask R-CNN. تظهر التجارب أن PAN يمكنها قمع الإنذارات الخاطئة الناجمة عن خلفيات تشبه النص بشكل أكثر فعالية.لقد حقق النهج المقترح أداءً متفوقًا في مهام الاختبار المرجعي لكشف النصوص متعددة الاتجاهات (ICDAR-2015، ICDAR-2017 MLT)والنصوص المنحنية (SCUT-CTW1500) باستخدام اختبار ذو نطاق واحد ونموذج واحد فقط.