توليد الصور المشروط باستخدام مفككي PixelCNN

يستكشف هذا العمل توليد الصور المشروط باستخدام نموذج كثافة صور جديد يعتمد على هندسة PixelCNN. يمكن تكييف النموذج بأي متجه، بما في ذلك العلامات الوصفية أو الهاشتاغات، أو التضمينات المخفية التي تم إنشاؤها بواسطة شبكات أخرى. عند تكييفه بالعلامات الفئوية من قاعدة بيانات ImageNet، يكون النموذج قادرًا على توليد مشاهد متنوعة وواقعية تمثل حيوانات وأشياء ومعالم طبيعية وهياكل مختلفة. عند تكييفه بتضمين يتم إنتاجه بواسطة شبكة انتقالية معطاة صورة واحدة لوجه غير معروف، فإنه يولد مجموعة متنوعة من الصور الشخصية لنفس الشخص بتعبيرات وجه مختلفة ومواقف وأوضاع إضاءة متنوعة. نوضح أيضًا أن PixelCNN المشروط يمكن أن يعمل كمفكك قوي في ترميز الصور ذاتيًا. بالإضافة إلى ذلك، فإن الطبقات الانتقالية المُحكَمة في النموذج المقترح تحسن احتمالية اللوغاريتم لـ PixelCNN لتتوافق مع أداء PixelRNN الرائد على ImageNet، مع خفض كبير في التكلفة الحسابية.