NMS-Loss: التعلم مع تثبيط القيم القصوى للكشف عن المشاة المزدحمين

يُعدّ قمع القيم غير القصوى (Non-Maximum Suppression (NMS)) ضروريًا للكشف عن الكائنات، ويؤثر على نتائج التقييم من خلال إدخال حالات إيجابية كاذبة (FP) وسلبيات كاذبة (FN)، خاصة في المشاهد التي تشهد اكتظاظًا وانسدادًا بالكائنات. في هذه الورقة، نُبرز المشكلة الناتجة عن الربط الضعيف بين أهداف التدريب ومقاييس التقييم الناتجة عن استخدام NMS، ونُقدّم خسارة جديدة تُسمى NMS-Loss، تُمكّن عملية NMS من التدريب بشكل متكامل (end-to-end) دون الحاجة إلى إضافة أي معاملات شبكة إضافية. تُعاقب خسارة NMS-Loss حالتين: الأولى عندما لا يتم قمع الإيجابيات الكاذبة (FP)، والثانية عندما يتم إزالة السلبيات الكاذبة (FN) بشكل خاطئ بواسطة NMS. بشكل محدد، نُقدّم خسارة جذب (pull loss) لجذب التنبؤات التي تشير إلى نفس الهدف نحو بعضها البعض، وخسارة دفع (push loss) لدفع التنبؤات التي تشير إلى أهداف مختلفة بعيدًا عن بعضها البعض. تُظهر النتائج التجريبية أن استخدام خسارة NMS-Loss يُسهم في تحقيق أداء متميز من قِبل كاشفنا، المُسمّى NMS-Ped، حيث بلغ معدل التفويت (Miss Rate) 5.92% على مجموعة بيانات Caltech، و10.08% على مجموعة بيانات CityPersons، وهما نتائج أفضل من جميع المنافسين ذوي التقنية الرائدة في المجال.