Command Palette
Search for a command to run...
توليد الوجوه ثلاثية الأبعاد باستخدام الترميز الشبكي الإدغامي
توليد الوجوه ثلاثية الأبعاد باستخدام الترميز الشبكي الإدغامي
Anurag Ranjan Timo Bolkart Soubhik Sanyal Michael J. Black
الملخص
التمثيلات ثلاثية الأبعاد للوجوه البشرية مفيدة لمشكلات رؤية الحاسوب مثل تتبع الوجه ثلاثي الأبعاد وإعادة بنائه من الصور، بالإضافة إلى تطبيقات الرسومات مثل إنشاء الشخصيات والرسوم المتحركة. النماذج التقليدية تتعلم تمثيلاً خفيًا للوجه باستخدام الفضاءات الخطية الفرعية أو تعميمات الموتر من الرتبة الأعلى. نظرًا لهذه الخصائص الخطية، لا يمكنها التقاط التشوهات الشديدة والتعبيرات غير الخطية. لحل هذه المشكلة، نقدم نموذجاً متعدد الاستخدامات يتعلم تمثيلاً غير خطي للوجه باستخدام التحويلات الطيفية على سطح الشبكة (mesh). نقدم عمليات عينات الشبكة التي تمكن من تمثيل شبكي هرمي يلتقط التغيرات غير الخطية في الشكل والتعبير بمستويات متعددة داخل النموذج. في الإعداد المتغير، يقوم نموذجنا بأخذ عينات من وجوه ثلاثية الأبعاد واقعية ومتنوعة من توزيع غاوس متعدد المتغيرات. تتكون بيانات التدريب الخاصة بنا من 20,466 شبكة (mesh) للتعبيرات الشديدة التي تم التقاطها عبر 12 موضوعًا مختلفًا. رغم قلة بيانات التدريب، فإن النموذج الذي تم تدريبه لدينا يتفوق على أفضل النماذج الحالية للوجوه بنسبة خطأ إعادة بناء أقل بنسبة 50٪، مع استخدام 75٪ أقل من المعلمات. كما نظهر أن استبدال فضاء التعبير في نموذج وجه حالي رائد بأوتوكودر (autoencoder) الخاص بنا يؤدي إلى خطأ إعادة بناء أدنى. البيانات والنماذج والكود متاحة على الرابط http://github.com/anuragranj/coma.