HyperAIHyperAI
منذ 17 أيام

إياغان: بحث معماري تطوري ثنائي المرحلة بكفاءة لشبكات الجيل التوليدي (GANs)

Guohao Ying, Xin He, Bin Gao, Bo Han, Xiaowen Chu
إياغان: بحث معماري تطوري ثنائي المرحلة بكفاءة لشبكات الجيل التوليدي (GANs)
الملخص

أثبتت الشبكات التوليدية المتنافسة (GANs) نجاحها في مهام توليد الصور. ومع ذلك، فإن تدريب GANs يُعد بطبيعته غير مستقر. وعلى الرغم من أن العديد من الدراسات حاولت تثبيت التدريب من خلال تعديل يدوي لبنية GAN، فإن هذا يتطلب خبرة كبيرة. أصبح البحث في البنية العصبية (NAS) حلاً جذابًا للبحث تلقائيًا عن بنى GAN. في البداية، كان يقتصر البحث في NAS-GAN على مولدات G فقط لتقليل تعقيد البحث، لكن هذا أدى إلى نتائج غير مثلى. حاولت بعض الدراسات الحديثة البحث عن كل من المُولِّد (G) والمقَبِّل (D)، لكنها تعاني من عدم استقرار تدريب GAN. ولتخفيف هذه المشكلة، نقترح إطارًا فعّالًا قائمًا على خوارزمية تطورية ثنائية المراحل للبحث عن GAN، يُسمى EAGAN. نفصل عملية البحث عن G وD إلى مرحلتين: حيث تبحث المرحلة الأولى في G مع الحفاظ على D ثابتًا، وتستخدم استراتيجية التدريب "كثير إلى واحد"، بينما تبحث المرحلة الثانية في D باستخدام G الأمثل المُكتشف في المرحلة الأولى، وتستخدم استراتيجيتي التدريب "واحد إلى واحد" و"إعادة تعيين الأوزان" لتعزيز استقرار تدريب GAN. وتستخدم كلا المرحلتين طريقة الترتيب غير المهيمن (non-dominated sorting) لإنتاج بنى معمارية على منحنى باريتو تحت عدة أهداف (مثل حجم النموذج، وScore Inception (IS)، ومسافة Fréchet Inception (FID)). تم تطبيق EAGAN على مهمة توليد الصور غير المشروطة، ويمكنه إنجاز عملية البحث بكفاءة على مجموعة بيانات CIFAR-10 خلال 1.2 يومًا من استخدام وحدة معالجة الرسومات (GPU). وتحقق النماذج المُستَرَدة من EAGAN نتائج تنافسية (IS = 8.81 ± 0.10، FID = 9.91) على مجموعة CIFAR-10، وتتفوّق على النماذج السابقة من نوع NAS-GAN على مجموعة STL-10 (IS = 10.44 ± 0.087، FID = 22.18). رابط الكود المصدري: https://github.com/marsggbo/EAGAN.

إياغان: بحث معماري تطوري ثنائي المرحلة بكفاءة لشبكات الجيل التوليدي (GANs) | أحدث الأوراق البحثية | HyperAI