ستار-نيت: شبكة انتباه مكانيّة مُتبقّية للتعرف على النص في المشهد.
في هذه الورقة، نقدم شبكةً جديدةً تُدعى STAR-Net (شبكة الانتباه المكاني المُعادِل) لتمييز النصوص في المشاهد. تم تجهيز STAR-Net بآلية انتباه مكانيّة تستخدم محولًا مكانيًّا لإزالة التشوهات التي تظهر في النصوص ضمن الصور الطبيعية. هذا يسمح للمُستخرج المُميزات التالي بالتركيز على المنطقة المُستقيمة للنص دون أن يشتت انتباهه بسبب التشوهات. كما تستفيد STAR-Net من كتل التبديل التلافيفي (residue convolutional blocks) لبناء مستخرج مميزات عميق جدًا، وهو أمر بالغ الأهمية لاستخلاص مميزات نصية تمييزية بنجاح في هذه المهمة الدقيقة التمييز. وبدمج آلية الانتباه المكاني مع كتل التبديل التلافيفي، تُعد STAR-Net أعمق شبكة عصبية قابلة للتدريب من البداية إلى النهاية لتمييز النصوص في المشاهد. تم إجراء تجارب على خمسة مجموعات بيانات معيارية عامة. أظهرت النتائج التجريبية أن STAR-Net يمكنها تحقيق أداءً يُقارن بأفضل الطرق الحالية في تمييز النصوص ذات التشوهات البسيطة، كما تتفوّق على هذه الطرق في حالة النصوص ذات التشوهات الكبيرة.