Command Palette
Search for a command to run...
دروس مستفادة من تدريب الشبكات التوليدية التنافسية على مجموعات بيانات اصطناعية
دروس مستفادة من تدريب الشبكات التوليدية التنافسية على مجموعات بيانات اصطناعية
Shichang Tang
الملخص
لقد حققت الشبكات التوليدية التنافسية (GANs) تقدماً كبيراً في توليد صور واقعية في السنوات الأخيرة. ومع ذلك، غالبًا ما تُدرَّب هذه الشبكات على مجموعات بيانات صور تحتوي إما على عدد قليل جدًا من العينات، أو على عدد كبير جدًا من الفئات التي تنتمي إلى توزيعات بيانات مختلفة. ونتيجة لذلك، تكون الشبكات عرضة للتحصيل غير الكافي (underfitting) أو التعلم الزائد (overfitting)، مما يجعل تحليلها صعبًا ومحدودًا. ولذلك، بهدف إجراء دراسة شاملة على الشبكات التوليدية التنافسية مع تجنب التداخلات غير الضرورية الناتجة عن مجموعات البيانات، نُدرّب هذه الشبكات على مجموعات بيانات اصطناعية، حيث تتوفر عدد لا نهائي من العينات، وتكون توزيعات البيانات الحقيقية بسيطة وعالية الأبعاد وتمتلك هيكلًا متعدد الأبعاد منظمًا (structured manifolds). علاوةً على ذلك، تم تصميم المولّدات (generators) بحيث توجد مجموعات مثالية من المعاملات. و empirically، وجدنا أن المولّدات لا تتمكن من تعلّم هذه المعاملات المثالية باستخدام عملية تدريب GAN، وذلك تحت مختلف مقاييس المسافة. كما لاحظنا أن تدريب خليط من الشبكات التوليدية التنافسية يؤدي إلى تحسين أداء أكبر مقارنةً بزيادة عمق الشبكة أو عرضها، عندما تكون تعقيدات النموذج كافية. تُظهر نتائج تجاربنا أن خليط من المولّدات يمكنه اكتشاف أنماط مختلفة أو فئات مختلفة تلقائيًا في بيئة غير مراقبة (unsupervised)، وهو ما نُعزّي إلى توزيع مهام التوليد والتمييز بين عدة مولّدات ومحكمات (discriminators). كمثال على قابلية تعميم استنتاجاتنا إلى مجموعات بيانات واقعية، قمنا بتدريب خليط من الشبكات التوليدية التنافسية على مجموعة بيانات CIFAR-10، وقد تفوقت طريقة تدريسيتنا بشكل كبير على أحدث الأداءات في مقاييس شائعة، مثل "مقياس إنسيبشن" (Inception Score - IS) و"المسافة فريشيت إنسيبشن" (Fréchet Inception Distance - FID).