اكتشاف النص متعدد الاتجاهات باستخدام اقتراحات المناطق المستندة إلى الزوايا

الطرق السابقة لاكتشاف النصوص في المشاهد تعتمد عادةً على النوافذ المتزحلقة المحددة يدويًا. يقدم هذا العمل طريقة منطقية ذات مرحلتين تعتمد على المناطق لاكتشاف النصوص متعددة الاتجاهات دون أي معرفة سابقة بأشكال النص. في المرحلة الأولى، نقدر مواقع النصوص المحتملة من خلال اكتشاف وربط الزوايا بدلاً من تحريك مجموعة من الأ瞄كث الثابتة (default anchors). تكون مقترحات الرباعيات متكيفة مع الهندسة، مما يسمح لطريقتنا بالتعامل مع نسب مختلفة للنصوص وأتجاهاتها. في المرحلة الثانية، نصمم طبقة تجميع جديدة تُسمى Dual-RoI Pooling والتي تدمج زيادة البيانات داخل الشبكة الفرعية الخاصة بالمنطقة لتحقيق تصنيف وانحدار أكثر ثباتًا لهذه المقترحات. تؤكد نتائج التجارب على المعايير العامة أن الطريقة المقترحة قادرة على تحقيق أداء مكافئ لأفضل الطرق الحالية. يمكن الوصول إلى الكود بشكل عام عبر الرابط: https://github.com/xhzdeng/crpn