استكشاف التوازن في تصنيف الكشف عن الأشياء ذي الذيل الطويل

تتجه الأجهزة التقليدية للكشف إلى إجراء تصنيف غير متوازن وتواجه انخفاضًا في الأداء عندما تكون توزيعات بيانات التدريب مائلة بشدة. في هذا البحث، نقترح استخدام متوسط درجة التصنيف لتحديد دقة التصنيف لكل فئة أثناء التدريب. استنادًا إلى هذا المؤشر، نقوم بتوازن التصنيف من خلال خسارة التوازن (Equilibrium Loss - EBL) وطريقة العينات المُحسّنة بالذاكرة (Memory-augmented Feature Sampling - MFS). بوجه خاص، تزيد خسارة التوازن (EBL) من شدة تعديل حد القرار للصفوف الضعيفة من خلال هامش خسارة موجه بالدرجات مصمم بين أي فئتين. من ناحية أخرى، تحسن طريقة العينات المُحسّنة بالذاكرة (MFS) من تكرار ودقة تعديل حد القرار للصفوف الضعيفة عن طريق زيادة عينات الخصائص لهذه الصفوف. وهكذا، تعمل خسارة التوازن (EBL) والعينات المُحسّنة بالذاكرة (MFS) بشكل تعاوني لاكتشاف توازن التصنيف في الكشف ذي الذيل الطويل، مما يعزز بشكل كبير أداء الصفوف المتاخمة مع الحفاظ على أو حتى تحسين أداء الصفوف الرئيسية. قمنا بإجراء التجارب على LVIS باستخدام Mask R-CNN مع مجموعة متنوعة من الهياكل الأساسية مثل ResNet-50-FPN وResNet-101-FPN لإظهار تفوق الطريقة المقترحة. حيث يحسن أداء الكشف للصفوف المتاخمة بمقدار 15.6 AP، ويتفوق على أفضل كاشفات الأشياء ذات الذيل الطويل الحديثة بأكثر من 1 AP. يمكن الحصول على الرمز البرمجي من https://github.com/fcjian/LOCE.