HyperAIHyperAI
منذ 11 أيام

التجربة الافتراضية الشاملة مع التحويل الثلاثي المستوي المتكرر

{Ziwei Liu, Xinrui Yu, Han Yang}
التجربة الافتراضية الشاملة مع التحويل الثلاثي المستوي المتكرر
الملخص

تهدف المحاكاة الافتراضية للملابس إلى نقل صورة ملابس مستهدفة إلى شخص مرجعي. وعلى الرغم من التقدم الكبير الذي تم إحرازه، لا يزال نطاق العمل في الدراسات الحالية محدودًا بالملابس القياسية (مثل القميص البسيط دون زخارف معقدة أو تأثيرات تمزق)، بينما يتم تجاهل التعقيد والتنوع الكبيرين للملابس غير القياسية (مثل القميص المفتوح على الكتف أو الفستان ذات الكتف المفتوح). في هذا العمل، نقترح إطارًا منهجيًا، يُسمى تحويل ثلاثي المستويات المتكرر (RT-VTON)، يقوم بتنفيذ المحاكاة الافتراضية الشاملة لكل من الملابس القياسية وغير القياسية. ونستند إلى رؤيتين رئيسيتين في تصميم هذا الإطار: 1) يتطلب نقل المعنى تحويلًا تدريجيًا للسمات عبر ثلاث مستويات مختلفة من تمثيل الملابس، وهي: رمز الملابس، ورمز الوضعية، ورمز التحليل البصري. 2) يتطلب نقل الهندسة تشوهًا مُنظَّمًا للصورة بين المرونة والصلابة. أولاً، نُقدِّر معنى الشخص "بعد المحاكاة" من خلال تحسين متكرر لرموز الميزات الثلاثية باستخدام انتباه مُحكم محليًا وتعلُّم تقابل غير محلي. ثانياً، نصمم تشوهًا شبه صلب لمحاذاة صورة الملابس مع المعنى المُقدَّر، مع الحفاظ على تشابه التشوهات المحلية. أخيرًا، يدمج مُولِّد المحاكاة القياسي جميع المعلومات المعالجة لإنتاج صورة الشخص المُلبَّس. أظهرت التجارب الواسعة على المعايير التقليدية، بالإضافة إلى دراسات المستخدمين، أن إطارنا يحقق أداءً متميزًا على مستوى عالٍ من حيث الجوانب الكمية والنوعية. وبشكل ملحوظ، تُظهر RT-VTON نتائج مُقنعة على مجموعة واسعة من الملابس غير القياسية.

التجربة الافتراضية الشاملة مع التحويل الثلاثي المستوي المتكرر | أحدث الأوراق البحثية | HyperAI