ARCH: إعادة بناء الأشخاص الملبسين بطريقة قابلة للتحريك

في هذا البحث، نقترح ARCH (إعادة بناء الأشخاص الملبسين القابلة للتحريك)، وهو إطار جديد من النهاية إلى النهاية لإعادة بناء دقيقة لأشخاص ثلاثية الأبعاد ملبسين وجاهزين للتحريك من صورة أحادية العدسة. تجد الطرق الحالية لإعادة بناء الأشخاص الثلاثية الأبعاد صعوبة في التعامل مع تغيرات الوضعيات واستعادة التفاصيل. كما أنها لا تنتج نماذج جاهزة للتحريك. على العكس من ذلك، ARCH هو نموذج تم تعلمه ويعتمد على الوعي بالوضعيات، ويقوم بإنتاج أفاتار بشرية كاملة الجسم ومفصلة ثلاثية الأبعاد من صورة RGB غير مقيدة واحدة. يتم إنشاء فضاء دلالي وحقل تشوه دلالي باستخدام تقدير جسم ثلاثي الأبعاد معلمي. يسمحان بتحويل البشر الملبيسين ثنائية أو ثلاثية الأبعاد إلى فضاء قياسي، مما يقلل من الغموض في الهندسة الناجم عن تغيرات الوضعيات والاخفاء في بيانات التدريب. يتم تعلم الهندسة السطحية المفصلة والمظهر باستخدام تمثيل دالة ضمنية مع خصائص محلية فضائية. علاوة على ذلك، نقترح إشرافًا إضافيًا لكل بكسل على إعادة بناء الصور الثلاثية الأبعاد باستخدام التحويل المرئي القابل للمفاضلة والمعتبر شفافية. تشير تجاربنا إلى أن ARCH يزيد من الدقة في إعادة بناء البشر. نحصل على أخطاء إعادة بناء أقل بنسبة أكثر من 50% للمعايير القياسية مقارنة بالأساليب الرائدة حاليًا في مجموعة البيانات العامة. كما نقدم العديد من الأمثلة النوعية لأفاتار متحركة ذات جودة عالية لم يتم رؤيتها حتى الآن في الأدب العلمي.