منذ 2 أشهر
StarGAN v2: توليف صور متنوعة لعدة مجالات
Choi, Yunjey ; Uh, Youngjung ; Yoo, Jaejun ; Ha, Jung-Woo

الملخص
يجب على نموذج جيد لترجمة الصور أن يتعلم الخريطة بين مجالات بصرية مختلفة مع الوفاء بالخصائص التالية: 1) تنوع الصور المولدة و2) قابلية التوسع عبر عدة مجالات. تتعامل الأساليب الحالية مع إحدى المشكلتين، مما يؤدي إلى تنوع محدود أو عدة نماذج لكل المجالات. نقترح StarGAN v2، إطارًا واحدًا يعالج كلا المشكلتين ويظهر نتائجًا محسنة بشكل كبير مقارنة بالأسس. تؤكد التجارب على CelebA-HQ وعلى مجموعة بيانات جديدة لوجوه الحيوانات (AFHQ) تفوقنا من حيث الجودة البصرية والتنوع وقابلية التوسع. للمساعدة في تقييم نماذج ترجمة الصور بشكل أفضل، نقوم بإطلاق AFHQ، وهي صور عالية الجودة لوجوه الحيوانات ذات الاختلافات الكبيرة داخل وخارج المجال. يمكن العثور على الشفرة البرمجية والنماذج المدربة مسبقًا ومجموعة البيانات في https://github.com/clovaai/stargan-v2.