HyperAIHyperAI

Command Palette

Search for a command to run...

توليد الوجوه ثلاثية الأبعاد باستخدام الترميز الشبكي الإدغامي

Anurag Ranjan Timo Bolkart Soubhik Sanyal Michael J. Black

الملخص

التمثيلات ثلاثية الأبعاد للوجوه البشرية مفيدة لمشكلات رؤية الحاسوب مثل تتبع الوجه ثلاثي الأبعاد وإعادة بنائه من الصور، بالإضافة إلى تطبيقات الرسومات مثل إنشاء الشخصيات والرسوم المتحركة. النماذج التقليدية تتعلم تمثيلاً خفيًا للوجه باستخدام الفضاءات الخطية الفرعية أو تعميمات الموتر من الرتبة الأعلى. نظرًا لهذه الخصائص الخطية، لا يمكنها التقاط التشوهات الشديدة والتعبيرات غير الخطية. لحل هذه المشكلة، نقدم نموذجاً متعدد الاستخدامات يتعلم تمثيلاً غير خطي للوجه باستخدام التحويلات الطيفية على سطح الشبكة (mesh). نقدم عمليات عينات الشبكة التي تمكن من تمثيل شبكي هرمي يلتقط التغيرات غير الخطية في الشكل والتعبير بمستويات متعددة داخل النموذج. في الإعداد المتغير، يقوم نموذجنا بأخذ عينات من وجوه ثلاثية الأبعاد واقعية ومتنوعة من توزيع غاوس متعدد المتغيرات. تتكون بيانات التدريب الخاصة بنا من 20,466 شبكة (mesh) للتعبيرات الشديدة التي تم التقاطها عبر 12 موضوعًا مختلفًا. رغم قلة بيانات التدريب، فإن النموذج الذي تم تدريبه لدينا يتفوق على أفضل النماذج الحالية للوجوه بنسبة خطأ إعادة بناء أقل بنسبة 50٪، مع استخدام 75٪ أقل من المعلمات. كما نظهر أن استبدال فضاء التعبير في نموذج وجه حالي رائد بأوتوكودر (autoencoder) الخاص بنا يؤدي إلى خطأ إعادة بناء أدنى. البيانات والنماذج والكود متاحة على الرابط http://github.com/anuragranj/coma.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp