HyperAIHyperAI

Command Palette

Search for a command to run...

التدريب الدقيق الفئوي لتصنيف الصور متعدد التصنيفات باستخدام التسميات الجزئية

Yapeng Wang Wei Ke Tenglong Wang Xu Yang Chak Fong Chong

الملخص

تُعد مجموعات بيانات تصنيف الصور متعدد التصنيفات غالبًا غير مُعلَّمة بالكامل (حيث تكون معرفة العلامات فقط بالنسبة لبعض الفئات لكل عينة). إحدى الحلول الشائعة لتدريب الشبكات العصبية التلافيفية هي اعتبار جميع العلامات غير المعروفة على أنها علامات سلبية، وتُعرف هذه الطريقة بـ "النمط السلبي" (Negative mode). لكنها تؤدي إلى إنتاج علامات خاطئة بشكل غير متساوٍ عبر الفئات، مما يقلل من أداء التصنيف الثنائي في الفئات المختلفة إلى درجات متفاوتة. من ناحية أخرى، وعلى الرغم من أن "النمط المُهمل" (Ignore mode)، الذي يتجاهل مساهمة العلامات غير المعروفة، قد يكون أقل فعالية من النمط السلبي، إلا أنه يضمن عدم إدخال علامات خاطئة إضافية، وهو ما يفتقر إليه النمط السلبي. في هذا البحث، نقترح طريقة جديدة تُسمى "التعديل الدقيق حسب الفئة" (Category-wise Fine-Tuning - CFT)، وهي طريقة ما بعد التدريب يمكن تطبيقها على نموذج تم تدريبه باستخدام النمط السلبي لتحسين أدائه على كل فئة بشكل مستقل. بشكل خاص، تستخدم CFT النمط المُهمل لضبط التصحيح التدريجي للانحدار اللوجستي (Logistic Regressions - LRs) في طبقة التصنيف، واحدة تلو الأخرى. ويساهم استخدام النمط المُهمل في تقليل الانخفاضات في الأداء الناتجة عن العلامات الخاطئة الناتجة عن النمط السلبي أثناء التدريب. وبشكل خاص، تُستخدم خوارزمية الجينات (Genetic Algorithm - GA) والانحراف الثنائي للخطية (binary crossentropy) في CFT لضبط الانحدار اللوجستي. وقد تم تقييم فعالية طريقة الاقتراح على مجموعة بيانات مسابقة CheXpert، وحققت نتائج من الطراز الرائد، على ما نعلم. حيث حقق نموذج واحد مُقدَّم إلى خادم المسابقة لتقييم رسمي، متوسط AUC (mAUC) بلغ 91.82% على مجموعة الاختبار، وهو أعلى نتيجة لنموذج واحد في قائمة التصنيف (leaderboard) والأدبيات. علاوة على ذلك، حقق تجميع النماذج (ensemble) لدينا متوسط AUC بلغ 93.33% (تم إغلاق المسابقة مؤخرًا، وقمنا بتقييم التجميع على جهاز محلي بعد إتاحة مجموعة الاختبار للتحميل). وهذا يفوق أفضل نتيجة مسجلة في قائمة التصنيف والأدبيات (93.05%). بالإضافة إلى ذلك، تم تقييم فعالية طريقة الاقتراح أيضًا على النسخ المُعلَّمة جزئيًا من مجموعة بيانات MS-COCO.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp