HyperAIHyperAI
منذ 11 أيام

قتل طائرَين بحجرٍ واحد: تدريب فعّال ومقاوم لشبكات العصبونات العميقة لتمييز الوجوه باستخدام FC جزئي

Xiang An, Jiankang Deng, Jia Guo, Ziyong Feng, Xuhan Zhu, Jing Yang, Tongliang Liu
قتل طائرَين بحجرٍ واحد: تدريب فعّال ومقاوم لشبكات العصبونات العميقة لتمييز الوجوه باستخدام FC جزئي
الملخص

يُعدُّ التعلُّمُ لاستخلاص تمثيلات عميقة تمييزية باستخدام مجموعات بيانات ضخمة من البيئة الطبيعية (في الوسط البري) بحجم ملايين العناصر، مع استخدام خسارة سويفت مارجين القائمة على دالة التفعيل اللوجستية (margin-based softmax loss)، هو الأسلوب المُتفوِّق حاليًا في التعرف على الوجوه. ومع ذلك، فإن تكلفة الذاكرة والحساب للطبقة الكاملة الاتصال (Fully Connected - FC) تزداد بشكل خطي مع عدد الهويات في مجموعة التدريب. علاوةً على ذلك، تُعاني مجموعات البيانات الضخمة للتدريب حتمًا من تعارضات بين الفئات (inter-class conflict) وتوزيع غير متوازن (long-tailed distribution). في هذا البحث، نُقدِّم نسخة مُتَوَزِّعة التحديث لطبقة FC، تُسمَّى FC الجزئية (Partial FC - PFC). في كل تكرار (iteration)، يتم اختيار مراكز الفئات الموجبة، وعينة عشوائية من مراكز الفئات السلبية، لحساب خسارة سويفت مارجين القائمة على دالة التفعيل اللوجستية. ويُحتفَظ بجميع مراكز الفئات طوال عملية التدريب بأكملها، لكن يتم اختيار مجموعة جزئية منها فقط لتحديثها في كل تكرار. وبذلك، يتم تقليل بشكل كبير متطلبات الحوسبة، واحتمالية حدوث تعارضات بين الفئات، وتردد التحديثات السلبية (passive update) على مراكز الفئات في الذيل (tail class centers). وتم التأكيد على فعالية وقوة وفعالية PFC من خلال تجارب واسعة على مجموعات بيانات تدريب مختلفة، وباستخدام هياكل معمارية متنوعة (مثل الشبكات العصبية التلافيفية - CNN والشبكات القائمة على الانتباه - ViT). وتم إتاحة كود المصدر عبر الرابط التالي: \https://github.com/deepinsight/insightface/tree/master/recognition.

قتل طائرَين بحجرٍ واحد: تدريب فعّال ومقاوم لشبكات العصبونات العميقة لتمييز الوجوه باستخدام FC جزئي | أحدث الأوراق البحثية | HyperAI