VITON-HD: محاكاة افتراضية عالية الدقة للملابس من خلال التطبيع المُدرك للانحراف

تهدف مهمة المحاولة الافتراضية القائمة على الصور إلى نقل قطعة ملابس مستهدفة إلى المنطقة المقابلة على جسم الشخص، وهي تُعالج عادةً من خلال تكييف القطعة مع الجزء المطلوب من الجسم ثم دمج القطعة المشوهة مع الصورة البشرية. وعلى الرغم من التقدم المحرز في عدد الدراسات المتعددة، تظل دقة الصور المُولَّدة محدودة بالمستويات المنخفضة (مثل 256×192)، وهو ما يُعدّ العائق الرئيسي أمام رضا المستهلكين عبر الإنترنت. نحن نرى أن هذا التقييد ناتج عن عدة تحديات: مع زيادة الدقة، تصبح العيوب الناتجة عن عدم التوافق بين المناطق المشوهة للملابس والمناطق المستهدفة للملابس واضحة في النتائج النهائية؛ كما أن البنية المُستخدمة في الطرق الحالية تُظهر أداءً ضعيفًا في إنتاج أجزاء جسم عالية الجودة والحفاظ على وضوح نسيج الملابس. لمعالجة هذه التحديات، نقترح طريقة جديدة للمحاولة الافتراضية تُسمى VITON-HD، والتي تمكّن من إنتاج صور محاكاة افتراضية بدقة 1024×768. بشكل محدد، نبدأ أولاً بإعداد خريطة التجزئة لتوجيه عملية التوليد، ثم نقوم بتركيب تقريبي لقطعة الملابس المستهدفة على جسم الشخص المعطى. ثم نقترح تقنيتي التطبيع ALIgnment-Aware Segment (ALIAS) والمحول ALIAS لمعالجة المناطق غير المتطابقة والحفاظ على التفاصيل في الإدخالات بدقة 1024×768. ومن خلال مقارنة دقيقة مع الطرق الحالية، نُظهر أن VITON-HD تتفوق بشكل كبير على الطرق الأساسية من حيث جودة الصور المُولَّدة من حيث الجوانب الكمية والنوعية. يمكن الوصول إلى الشفرة المصدرية عبر الرابط: https://github.com/shadow2496/VITON-HD.