الانسجام المُتحكم به للصورة الشخصية باستخدام GAN المُحلّل للسمات

تُقدّم هذه الورقة نموذج GAN المُفكّك حسب السمات (Attribute-Decomposed GAN)، وهو نموذج توليدي جديد يهدف إلى توليد صور أشخاص قابلة للتحكم، حيث يمكنه إنتاج صور أشخاص واقعية تمتلك السمات البشرية المطلوبة (مثل الوضعية، الرأس، الجزء العلوي من الملابس، والبنطال) بناءً على مدخلات مصدرية متنوعة. تكمن الفكرة الأساسية في النموذج المُقترح في دمج السمات البشرية داخل الفضاء الخفي على شكل رموز مستقلة، مما يسمح بالتحكم المرن والمستمر في هذه السمات من خلال عمليات المزج والانسيابية (الاستيفاء) في تمثيلات نمطية صريحة. وبشكل خاص، تم اقتراح بنية جديدة تتكون من طريقتين ترميز مع روابط كتل نمطية، بهدف تفكيك التعيين الصعب الأصلي إلى مهام فرعية أكثر سهولة. في المسار المُدخل، نقوم باستخراج تخطيطات المكونات باستخدام معالج بشري جاهز (off-the-shelf human parser)، ثم نُدخل هذه التخطيطات إلى مشفر نسيج عالمي مشترك لإنتاج رموز خفية مفككة. يتيح هذا النهج توليد صور ناتجة أكثر واقعية، وتمييزًا تلقائيًا للسمات غير المُعلّمة. وتُظهر النتائج التجريبية تفوق الطريقة المقترحة على أحدث الطرق في مهمة نقل الوضعية، فضلًا عن كفاءتها في مهمة جديدة تمامًا هي نقل سمات المكونات.