HyperAIHyperAI
منذ 2 أشهر

خسارة التركيز للكشف الكثيف عن الأشياء

Lin, Tsung-Yi ; Goyal, Priya ; Girshick, Ross ; He, Kaiming ; Dollár, Piotr
خسارة التركيز للكشف الكثيف عن الأشياء
الملخص

أدق أجهزة الكشف عن الأشياء حتى الآن تعتمد على نهج ذو مرحلتين شاع استخدامه بفضل R-CNN، حيث يتم تطبيق تصنيف على مجموعة متباعدة من مواقع الأشياء المرشحة. بالمقابل، يمكن لأجهزة الكشف ذات المرحلة الواحدة، التي يتم تطبيقها على عينات كثيفة ومنتظمة من مواقع الأشياء الممكنة، أن تكون أسرع وأبسط، لكنها قد تخلفت في الدقة عن أجهزة الكشف ذات المرحلتين حتى الآن. في هذا البحث، نستكشف السبب في ذلك. اكتشفنا أن عدم التوازن الشديد بين فئات المقدمة والخلفية الذي يُواجه أثناء تدريب أجهزة الكشف الكثيفة هو السبب الرئيسي. نقترح معالجة هذا عدم التوازن بإعادة تشكيل خسارة التصنيف التقليدية (cross entropy loss) بحيث يتم تخفيض وزن الخسارة المخصصة للأمثلة الجيدة التصنيف. خسارتنا الجديدة "Focal Loss" تركز التدريب على مجموعة متباعدة من الأمثلة الصعبة وتمنع العدد الكبير من الأمثلة السلبية السهلة من إغراق جهاز الكشف أثناء التدريب. لتقدير فعالية خسارتنا، صممنا ودرّبنا جهاز كشف بسيط وكثيف نسميه "RetinaNet". تظهر نتائجنا أن عند تدريبه باستخدام الخسارة البؤرية (focal loss)، يكون "RetinaNet" قادراً على مجاراة سرعة أجهزة الكشف السابقة ذات المرحلة الواحدة بينما يتفوق على دقة جميع أجهزة الكشف الرائدة حاليًا ذات المرحلتين. الرمز البرمجي متاح في: https://github.com/facebookresearch/Detectron.