HyperAIHyperAI

Command Palette

Search for a command to run...

التجربة الافتراضية الشاملة مع التحويل الثلاثي المستوي المتكرر

Ziwei Liu Xinrui Yu Han Yang

الملخص

تهدف المحاكاة الافتراضية للملابس إلى نقل صورة ملابس مستهدفة إلى شخص مرجعي. وعلى الرغم من التقدم الكبير الذي تم إحرازه، لا يزال نطاق العمل في الدراسات الحالية محدودًا بالملابس القياسية (مثل القميص البسيط دون زخارف معقدة أو تأثيرات تمزق)، بينما يتم تجاهل التعقيد والتنوع الكبيرين للملابس غير القياسية (مثل القميص المفتوح على الكتف أو الفستان ذات الكتف المفتوح). في هذا العمل، نقترح إطارًا منهجيًا، يُسمى تحويل ثلاثي المستويات المتكرر (RT-VTON)، يقوم بتنفيذ المحاكاة الافتراضية الشاملة لكل من الملابس القياسية وغير القياسية. ونستند إلى رؤيتين رئيسيتين في تصميم هذا الإطار: 1) يتطلب نقل المعنى تحويلًا تدريجيًا للسمات عبر ثلاث مستويات مختلفة من تمثيل الملابس، وهي: رمز الملابس، ورمز الوضعية، ورمز التحليل البصري. 2) يتطلب نقل الهندسة تشوهًا مُنظَّمًا للصورة بين المرونة والصلابة. أولاً، نُقدِّر معنى الشخص "بعد المحاكاة" من خلال تحسين متكرر لرموز الميزات الثلاثية باستخدام انتباه مُحكم محليًا وتعلُّم تقابل غير محلي. ثانياً، نصمم تشوهًا شبه صلب لمحاذاة صورة الملابس مع المعنى المُقدَّر، مع الحفاظ على تشابه التشوهات المحلية. أخيرًا، يدمج مُولِّد المحاكاة القياسي جميع المعلومات المعالجة لإنتاج صورة الشخص المُلبَّس. أظهرت التجارب الواسعة على المعايير التقليدية، بالإضافة إلى دراسات المستخدمين، أن إطارنا يحقق أداءً متميزًا على مستوى عالٍ من حيث الجوانب الكمية والنوعية. وبشكل ملحوظ، تُظهر RT-VTON نتائج مُقنعة على مجموعة واسعة من الملابس غير القياسية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp