توليد صورة الشخص المفككة

إنشاء صور جديدة ومعقولة للأشخاص هو مهمة صعبة بسبب التفاعل المعقد بين عوامل الصورة المختلفة، مثل المقدمة والخلفية ومعلومات الوضع. في هذا البحث، نهدف إلى إنشاء هذه الصور باستخدام خط أنابيب إعادة بناء جديد ومكون من مرحلتين يتعلم تمثيلًا مفككًا لعوامل الصورة المذكورة أعلاه ويولد صور أشخاص جديدة في الوقت نفسه. أولاً، يتم اقتراح شبكة إعادة بناء متعددة الفروع لتفكيك وترميز العوامل الثلاثة إلى خصائص مضمنة، والتي تُجمع بعد ذلك لإعادة تركيب الصورة الإدخال نفسها. ثانياً، يتم تعلم ثلاث دوال رسم متناظرة بطريقة معادية لتحويل الضوضاء الجاوسية إلى فضاء الخصائص المضمنة التي تم تعلمها لكل عامل على حدة. باستخدام الإطار المقترح، يمكننا التحكم في المقدمة والخلفية ووضع الصورة الإدخال، بالإضافة إلى سحب خصائص مضمنة جديدة لتوليد مثل هذه التعديلات المستهدفة التي توفر المزيد من السيطرة على عملية التوليد. تظهر التجارب على مجموعتي البيانات Market-1501 وDeepfashion أن نموذجنا لا يولد فقط صور أشخاص واقعية ذات مقدمات وخلفيات وأوضاع جديدة، بل يعدل أيضًا في العوامل المنتجة ويقوم بتمثيل الحالات الوسيطة. كما تظهر مجموعة أخرى من التجارب على Market-1501 أن نموذجنا يمكن أن يكون مفيدًا أيضًا للمهمة الخاصة بإعادة تحديد الأشخاص (Person Re-Identification).