Command Palette
Search for a command to run...
توليد صورة شخصية موجهة بالوضع
توليد صورة شخصية موجهة بالوضع
الملخص
تقدم هذه الورقة البحثية نموذجًا جديدًا لولادة صور الأشخاص يُعرف بـ (PG²)، والذي يمكّن من توليد صور أشخاص بوضعيات متعددة ومتناهية التحديد، بالاعتماد على صورة واحدة للشخص ووضعية جديدة. يعتمد إطار العمل الخاص بنا، PG²، على معلومات الوضعية بشكل صريح، ويتكون من مرحلتين رئيسيتين: دمج الوضعية وتحسين الصورة. في المرحلة الأولى، يتم إدخال الصورة الشرطية والوضعية المستهدفة إلى شبكة من نوع U-Net لإنتاج صورة أولية لكنها خشنة للشخص بوضعية الهدف. أما في المرحلة الثانية، فيتم تحسين الناتج الأولي الضبابي من خلال تدريب منشئ من نوع U-Net بطريقة تعاونية (أي بطريقة معارضة). أظهرت النتائج التجريبية الواسعة على صور إعادة التعرف بحجم 128×64، وعلى صور أزياء بحجم 256×256، أن النموذج يُنتج صورًا عالية الجودة للأشخاص، تتميز بتفاصيل واقعية ومُقنعة.