الانحدار الحساس للدوران للكشف عن النص المشهد الموجه

النص في الصور الطبيعية يكون باتجاهات عشوائية، مما يتطلب اكتشافه من خلال مربعات الحدود الموجهة. عادةً، يشمل الكاشف المتعدد الاتجاهات للنصوص مهامين أساسيتين: 1) اكتشاف وجود النص، وهو مشكلة تصنيف لا تأخذ في الاعتبار اتجاه النص؛ 2) الانحدار لمربع الحدود الموجهة، والذي يهتم باتجاه النص. تعاني الأساليب السابقة من أداء متدهور بسبب عدم توافق هذين المهمتين عند الاعتماد على الخصائص المشتركة. لحل هذه المشكلة، نقترح إجراء التصنيف والانحدار على خصائص مختلفة مستخرجة بواسطة فرعين مختلفي التصميم في الشبكة العصبية. بالتحديد، يقوم الفرع المسؤول عن الانحدار باستخراج الخصائص الحساسة للدوران من خلال تدوير مرشحات التحويل بشكل نشط، بينما يستخرج الفرع المسؤول عن التصنيف الخصائص غير الحساسة للدوران من خلال جمع الخصائص الحساسة للدوران. الطريقة المقترحة التي تم تسميتها بكاشف الانحدار الحساس للدوران (RRD) تحقق أفضل الأداء على ثلاثة مجموعات بيانات مرجعية للنصوص المشهدية الموجهة، بما في ذلك ICDAR 2015 و MSRA-TD500 و RCTW-17 و COCO-Text. بالإضافة إلى ذلك، حقق RRD تحسيناً كبيراً على مجموعة بيانات لمجموعة سفن، مما يدل على قدرته العامة في اكتشاف الأشياء الموجهة.