Command Palette
Search for a command to run...
التدريب الدقيق الفئوي لتصنيف الصور متعدد التصنيفات باستخدام التسميات الجزئية
التدريب الدقيق الفئوي لتصنيف الصور متعدد التصنيفات باستخدام التسميات الجزئية
Yapeng Wang Wei Ke Tenglong Wang Xu Yang Chak Fong Chong
الملخص
تُعد مجموعات بيانات تصنيف الصور متعدد التصنيفات غالبًا غير مُعلَّمة بالكامل (حيث تكون معرفة العلامات فقط بالنسبة لبعض الفئات لكل عينة). إحدى الحلول الشائعة لتدريب الشبكات العصبية التلافيفية هي اعتبار جميع العلامات غير المعروفة على أنها علامات سلبية، وتُعرف هذه الطريقة بـ "النمط السلبي" (Negative mode). لكنها تؤدي إلى إنتاج علامات خاطئة بشكل غير متساوٍ عبر الفئات، مما يقلل من أداء التصنيف الثنائي في الفئات المختلفة إلى درجات متفاوتة. من ناحية أخرى، وعلى الرغم من أن "النمط المُهمل" (Ignore mode)، الذي يتجاهل مساهمة العلامات غير المعروفة، قد يكون أقل فعالية من النمط السلبي، إلا أنه يضمن عدم إدخال علامات خاطئة إضافية، وهو ما يفتقر إليه النمط السلبي. في هذا البحث، نقترح طريقة جديدة تُسمى "التعديل الدقيق حسب الفئة" (Category-wise Fine-Tuning - CFT)، وهي طريقة ما بعد التدريب يمكن تطبيقها على نموذج تم تدريبه باستخدام النمط السلبي لتحسين أدائه على كل فئة بشكل مستقل. بشكل خاص، تستخدم CFT النمط المُهمل لضبط التصحيح التدريجي للانحدار اللوجستي (Logistic Regressions - LRs) في طبقة التصنيف، واحدة تلو الأخرى. ويساهم استخدام النمط المُهمل في تقليل الانخفاضات في الأداء الناتجة عن العلامات الخاطئة الناتجة عن النمط السلبي أثناء التدريب. وبشكل خاص، تُستخدم خوارزمية الجينات (Genetic Algorithm - GA) والانحراف الثنائي للخطية (binary crossentropy) في CFT لضبط الانحدار اللوجستي. وقد تم تقييم فعالية طريقة الاقتراح على مجموعة بيانات مسابقة CheXpert، وحققت نتائج من الطراز الرائد، على ما نعلم. حيث حقق نموذج واحد مُقدَّم إلى خادم المسابقة لتقييم رسمي، متوسط AUC (mAUC) بلغ 91.82% على مجموعة الاختبار، وهو أعلى نتيجة لنموذج واحد في قائمة التصنيف (leaderboard) والأدبيات. علاوة على ذلك، حقق تجميع النماذج (ensemble) لدينا متوسط AUC بلغ 93.33% (تم إغلاق المسابقة مؤخرًا، وقمنا بتقييم التجميع على جهاز محلي بعد إتاحة مجموعة الاختبار للتحميل). وهذا يفوق أفضل نتيجة مسجلة في قائمة التصنيف والأدبيات (93.05%). بالإضافة إلى ذلك، تم تقييم فعالية طريقة الاقتراح أيضًا على النسخ المُعلَّمة جزئيًا من مجموعة بيانات MS-COCO.