HyperAIHyperAI

Command Palette

Search for a command to run...

تحسين نماذج GANs للبيانات ذات التوزيع الطويل الذيل من خلال الت régularization الطيفي المجموعة

Harsh Rangwani Naman Jaswani Tejan Karmali Varun Jampani R. Venkatesh Babu

الملخص

تهدف التعلم العميق ذي الذيل الطويل إلى تدريب شبكات عميقة مفيدة على توزيعات غير متوازنة واقعية في الحياة الحقيقية، حيث تكون معظم العلامات الخاصة بالفئات ذات الذيل المرفوع مرتبطّة بعدد قليل من العينات. سُجّل عدد كبير من الدراسات لتدريب نماذج تمييزية للتمييز البصري على توزيعات ذات ذيل طويل. وعلى النقيض من ذلك، نهدف إلى تدريب شبكات توليدية مُشروطة من نوع الشبكات المتنافسة (Generative Adversarial Networks)، وهي فئة من نماذج توليد الصور، على توزيعات ذات ذيل طويل. ونلاحظ أن الطرق الحديثة المتطورة في توليد الصور تعاني أيضًا من تدهور الأداء بالنسبة للفئات ذات الذيل المرفوع، وهو ما يُعزى في المقام الأول إلى ظاهرة الانهيار المودي (mode collapse) المُحدّدة بالفئة، والتي نلاحظ ارتباطها بظاهرة الانفجار الطيفي (spectral explosion) في مصفوفة المعاملات المشروطة. ولحل هذه المشكلة، نقترح منظّمًا طيفيًا جماعيًا جديدًا (gSR) يمنع الانفجار الطيفي، مما يخفف من ظاهرة الانهيار المودي، ويؤدي إلى توليد صور متنوعة ومقنعة حتى للفئات ذات الذيل المرفوع. ونجد أن gSR يتكامل بشكل فعّال مع تقنيات التوسيع والتنظيم القائمة، مما يؤدي إلى أداء متميز في توليد الصور على البيانات ذات الذيل الطويل. وتُظهر التجارب الواسعة فعالية منظّمنا على مجموعات بيانات ذات ذيل طويل بدرجات مختلفة من التفاوت.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp