HyperAIHyperAI
منذ 8 أيام

إلى إعادة بناء الوجه البشري قياسياً

Wojciech Zielonka, Timo Bolkart, Justus Thies
إلى إعادة بناء الوجه البشري قياسياً
الملخص

إعادة بناء الوجه وتعقبه يُعدّ ركيزة أساسية لعدة تطبيقات في مجالات الواقع المعزز/الواقع الافتراضي، والتفاعل بين الإنسان والآلة، وكذلك التطبيقات الطبية. تعتمد معظم هذه التطبيقات على تنبؤ دقيق من حيث المقاييس بشكل الوجه، خاصةً عندما يتم وضع الموضوع المُعاد بناؤه في سياق مقياسي (أي عند وجود كائن مرجعي بحجم معروف). كما يُعدّ إعادة البناء المقياسي ضروريًا لأي تطبيق يقيس المسافات والأبعاد الخاصة بالوجه (مثل محاكاة تركيب إطار نظارات افتراضيًا). تُدرَّب معظم الطرق المتطورة لإعادة بناء الوجه من صورة واحدة على مجموعات بيانات ثنائية الأبعاد كبيرة بأسلوب ذاتي التدريب (self-supervised). ومع ذلك، نظرًا لطبيعة التProjectedية المنظورية (perspective projection)، فإن هذه الطرق لا تتمكن من إعادة بناء الأبعاد الحقيقية للوجه، بل إن التنبؤ بالوجه البشري المتوسط يتفوق في بعض الأحيان على هذه الطرق من حيث الدقة المقياسية. ونُقدّم حجّة لصالح استخدام نموذج تدريبي مُراقب (supervised) لتعلم الشكل الحقيقي للوجه. وبما أنّه لا توجد حتى الآن مجموعة بيانات ثلاثية الأبعاد كبيرة لهذا المهمة، فقد قمنا بتوحيد وتصنيف قواعد بيانات صغيرة ومتوسطة الحجم. ورغم أن المجموعة الموحّدة الناتجة لا تزال من الفئة المتوسطة الحجم (بأكثر من 2000 هوية)، فإن التدريب فقط عليها سيؤدي إلى التعلم الزائد (overfitting). ولحل هذه المشكلة، نستفيد من شبكة تم تدريبها مسبقًا على مجموعة بيانات ثنائية الأبعاد كبيرة للتمييز بين الوجوه، والتي توفر ميزات مميزة لكل وجه، وتكون مقاومة للتغيرات في التعبير، والإضاءة، وظروف الكاميرا. باستخدام هذه الميزات، نُدرّب مُقدّر شكل الوجه لدينا بطريقة مُراقبة، مُستفيدًا من مقاومة الشبكة الخاصة بالتمييز بين الوجوه وعموميتها. ويُظهر أسلوبنا، الذي أطلقنا عليه اسم MICA (MetrIC fAce)، تفوقًا كبيرًا على أفضل الطرق المُتاحة حاليًا لإعادة البناء، سواءً على المعايير الحالية غير المقياسية أو على معاييرنا المقياسية (بانخفاض بنسبة 15% و24% في الخطأ المتوسط على مجموعة بيانات NoW، على التوالي).