إنشاء صور مشروط باستخدام شبكات التوليد التنافسية مع تصنيف مساعد

إنشاء صور ذات دقة عالية وواقعية بصرياً كان تحدياً مستمراً في مجال التعلم الآلي. في هذا البحث، نقدم طرق جديدة لتحسين تدريب شبكات المولدات المعادية (GANs) لإنشاء الصور. قمنا ببناء نوع متطور من شبكات GANs يستخدم التحكم بالتصنيف، مما ينتج عنه عينات صورية بدقة 128x128 تتميز بالتماسك العالمي. نوسع في الأعمال السابقة لتقييم جودة الصور لنقدم تحليلين جديدين لتقييم تمييز العينات ومتنوعيتها من نماذج إنشاء الصور المشروطة بالتصنيف. يظهر هذان التحليلان أن العينات ذات الدقة العالية توفر معلومات تصنيفية غير موجودة في العينات ذات الدقة المنخفضة. عبر 1000 فئة من فئات ImageNet، تكون العينات بدقة 128x128 أكثر تمييزاً بمقدار أكثر من الضعف مقارنة بالعينات المصغرة اصطناعياً بدقة 32x32. بالإضافة إلى ذلك، تحتوي 84.7% من الفئات على عينات تظهر تنوعاً مشابهاً للبيانات الحقيقية لـ ImageNet.