HyperAIHyperAI
منذ 19 أيام

VarifocalNet: متغير التركيز - كاشف كثيف يراعي معامل التداخل بين المربعات

Haoyang Zhang, Ying Wang, Feras Dayoub, Niko Sünderhauf
VarifocalNet: متغير التركيز - كاشف كثيف يراعي معامل التداخل بين المربعات
الملخص

تصنيف دقيق للعدد الكبير من الكشفات المرشحة أمر بالغ الأهمية لتحسين أداء كاشفات الكائنات الكثيفة. في الدراسات السابقة، تم استخدام درجة التصنيف أو مزيج من درجة التصنيف ودرجة التوقع المكانية لتصنيف المرشحات. ومع ذلك، لا يؤدي أي من الخيارين إلى تصنيف موثوق، مما يؤدي إلى تدهور أداء الكشف. في هذه الورقة، نقترح تعلم درجة تصنيف واعية بـ IoU (Iou-aware Classification Score - IACS) كتمثيل مشترك لثقة وجود الكائن ودقة تحديد موقعه. ونُظهر أن كاشفات الكائنات الكثيفة يمكنها تحقيق تصنيف أكثر دقة للمرشحات بناءً على IACS. وقد قمنا بتصميم دالة خسارة جديدة تُسمى Varifocal Loss، لتدريب كاشف كائنات كثيفة على توقع IACS، واقترحنا تمثيلًا جديدًا لخصائص المربع المحصور على شكل نجمة (star-shaped bounding box feature representation) لتحسين توقع IACS وتحسين المربعات المحصورة. وبدمج هذين المكونين الجديدين مع فرع لتحسين المربعات المحصورة، قمنا ببناء كاشف كائنات كثيفة واعٍ بـ IoU مستندًا إلى بنية FCOS+ATSS، وسُمّي بـ VarifocalNet أو VFNet اختصارًا. أظهرت التجارب الواسعة على مجموعة بيانات MS COCO أن VFNet يتفوق باستمرار على النموذج القائم (الأساس) بنسبة تقارب 2.0 نقطة AP باستخدام معماريات مختلفة. وحقق أفضل نموذج لدينا، VFNet-X-1200، باستخدام Res2Net-101-DCN، نقطة AP قدرها 55.1 على مجموعة اختبار COCO test-dev، وهو الأفضل في فئته بين مختلف كاشفات الكائنات. يُمكن الاطلاع على الشيفرة المصدرية عبر الرابط: https://github.com/hyz-xmaster/VarifocalNet.