HyperAIHyperAI
منذ 11 أيام

تحسين نماذج GANs للبيانات ذات التوزيع الطويل الذيل من خلال الت régularization الطيفي المجموعة

Harsh Rangwani, Naman Jaswani, Tejan Karmali, Varun Jampani, R. Venkatesh Babu
تحسين نماذج GANs للبيانات ذات التوزيع الطويل الذيل من خلال الت régularization الطيفي المجموعة
الملخص

تهدف التعلم العميق ذي الذيل الطويل إلى تدريب شبكات عميقة مفيدة على توزيعات غير متوازنة واقعية في الحياة الحقيقية، حيث تكون معظم العلامات الخاصة بالفئات ذات الذيل المرفوع مرتبطّة بعدد قليل من العينات. سُجّل عدد كبير من الدراسات لتدريب نماذج تمييزية للتمييز البصري على توزيعات ذات ذيل طويل. وعلى النقيض من ذلك، نهدف إلى تدريب شبكات توليدية مُشروطة من نوع الشبكات المتنافسة (Generative Adversarial Networks)، وهي فئة من نماذج توليد الصور، على توزيعات ذات ذيل طويل. ونلاحظ أن الطرق الحديثة المتطورة في توليد الصور تعاني أيضًا من تدهور الأداء بالنسبة للفئات ذات الذيل المرفوع، وهو ما يُعزى في المقام الأول إلى ظاهرة الانهيار المودي (mode collapse) المُحدّدة بالفئة، والتي نلاحظ ارتباطها بظاهرة الانفجار الطيفي (spectral explosion) في مصفوفة المعاملات المشروطة. ولحل هذه المشكلة، نقترح منظّمًا طيفيًا جماعيًا جديدًا (gSR) يمنع الانفجار الطيفي، مما يخفف من ظاهرة الانهيار المودي، ويؤدي إلى توليد صور متنوعة ومقنعة حتى للفئات ذات الذيل المرفوع. ونجد أن gSR يتكامل بشكل فعّال مع تقنيات التوسيع والتنظيم القائمة، مما يؤدي إلى أداء متميز في توليد الصور على البيانات ذات الذيل الطويل. وتُظهر التجارب الواسعة فعالية منظّمنا على مجموعات بيانات ذات ذيل طويل بدرجات مختلفة من التفاوت.