الانتباه المتبقي: طريقة بسيطة ولكن فعّالة للتعرف على التصنيفات المتعددة

التعرف على الصور متعددة العلامات هو مهمة صعبة في مجال رؤية الحاسوب ذات الاستخدام العملي. ومع ذلك، غالباً ما يتميز التقدم في هذا المجال بطرق معقدة، وحسابات ثقيلة، ونقص في التفسيرات البديهية. لتقدير المناطق المكانية المختلفة التي تحتلها الأشياء من فئات مختلفة بشكل فعال، نقترح وحدة بسيطة للغاية تُسمى انتباه الفائض الخاص بالفئة (Class-Specific Residual Attention - CSRA). يولد CSRA خصائص خاصة بالفئة لكل فئة من خلال اقتراح درجة انتباه مكاني بسيط، ثم يقوم بدمجها مع ميزة التجميع المتوسط الذي لا يعتمد على الفئة. يحقق CSRA نتائج رائدة في مجال التعرف على الصور متعددة العلامات، وفي الوقت نفسه يكون أبسط بكثير منها. علاوة على ذلك، وباستخدام فقط 4 سطور من الكود، يؤدي CSRA إلى تحسين مستمر عبر العديد من النماذج المدربة مسبقًا والقواعد البيانات المتنوعة دون أي تدريب إضافي. يتمتع CSRA بسهولة التنفيذ وخفة الحسابات، كما أنه يتميز بتفسيرات وبديهيات مرئية.