التصنيف متعدد التصنيفات مع التسميات الجزئية باستخدام خسارة اختيارية واعية بالفئة

تُعدّ مجموعات البيانات الكبيرة لتصنيف متعدد التصنيفات جزئيًا، بشكل شائع وربما لا مفر منه، مُعلّمة جزئيًا. أي أن عدداً صغيرًا فقط من التصنيفات يُعلّم لكل عينة. وتفيد الطرق المختلفة لمعالجة التصنيفات المفقودة في تشكيل خصائص مختلفة للنموذج، مما يؤثر بدوره على دقة التصنيف. في هذه الدراسة، نحلل مشكلة التصنيف الجزئي، ثم نقترح حلًا يستند إلى فكرتين رئيسيتين. أولاً، ينبغي معالجة التصنيفات غير المُعلّمة بشكل انتقائي بناءً على كميتين احتماليتين: توزيع الفئة في مجموعة البيانات بأكملها، واحتمال التصنيف المحدد بالنسبة لعينة بيانات معينة. ونقترح تقدير توزيع الفئة باستخدام نموذج مؤقت مخصص، ونُظهر تفوقه في الكفاءة مقارنةً بالتقدير البسيط المستند إلى التصنيفات الجزئية المتوفرة في مجموعة البيانات. ثانيًا، أثناء تدريب النموذج المستهدف، نُعزز مساهمة التصنيفات المُعلّمة مقارنةً بالتصنيفات الأصلية غير المُعلّمة باستخدام دالة خسارة غير متماثلة مخصصة. وباستخدام منهجيتنا الجديدة، نحقق نتائج من الطراز الرائد على مجموعة بيانات OpenImages (مثلاً، الوصول إلى 87.3 mAP على الإصدار V6). وبالإضافة إلى ذلك، تُظهر التجارب التي أُجريت على مجموعتي بيانات LVIS وsimulated-COCO فعالية منهجيتنا. يمكن الوصول إلى الكود عبر الرابط: https://github.com/Alibaba-MIIL/PartialLabelingCSL.