HyperAIHyperAI

Command Palette

Search for a command to run...

تعلم التحويل الحر للتشوه لاستعادة الوجه ثلاثي الأبعاد من الصور البرية

Jung Harim ; Oh Myeong-Seok ; Lee Seong-Whan

الملخص

أظهرت نموذج الشكل القابل للتغيير ثلاثي الأبعاد (3DMM)، وهو نموذج إحصائي يعتمد على تحليل المكونات الرئيسية (PCA) ويستخدم دوال أساسية خطية لتمثيل الوجه ثلاثي الأبعاد، نتائج واعدة في إعادة بناء الوجوه ثلاثية الأبعاد من صور ملتقطة بشكل عشوائي من زاوية واحدة. ومع ذلك، فإن قوة تمثيل 3DMM محدودة بسبب العدد المحدود للمسح新三维 (3D scans) والأساس الخطي العالمي. لمعالجة هذه القيود، نقترح طريقة تعتمد على التعلم بسيطة تقوم بإعادة بناء شبكة الوجه ثلاثية الأبعاد لأول مرة باستخدام تشويه حر (FFD). يعتبر FFD طريقة نمذجة هندسية تدمج شبكة مرجعية داخل شبكة متوازية المستطيلات وتتشوه الشبكة عن طريق تحريك نقاط التحكم النادرة في الشبكة. بما أن FFD يعتمد على دوال أساسية معرفة رياضياً، فإنه لا يواجه أي قيود في قوة التمثيل. وبالتالي، يمكننا استعادة شبكات الوجه ثلاثية الأبعاد بدقة عن طريق تقدير الانحراف المناسب لنقاط التحكم كمعلمات تشويه. رغم أن كل من 3DMM وFFD هما نماذج معلمية، إلا أنه من الصعب التنبؤ بتأثير معالم 3DMM على شكل الوجه، بينما تكون معالم التشويه في FFD قابلة للتفهم فيما يتعلق بتأثيرها على الشكل النهائي للشبكة. هذا الميزة العملية لـ FFD تسمح لأن تكون الشبكة الناتجة ونقاط التحكم نقطة بداية جيدة لنمذجة الوجه ثلاثي الأبعاد، حيث يمكن للمستخدمين العاديين ضبط الشبكة بدقة باستخدام أدوات البرمجيات ثلاثية الأبعاد المتاحة على نطاق واسع. أظهرت التجارب التي أجريت على عدة مجموعات بيانات كيف أن طرحتنا تقدر بنجاح هندسة الوجه الثلاثي الأبعاد والتعبيرات الوجهية من صور الوجه ثنائية الأبعاد، مما حقق أداءً مشابهاً لأفضل الأساليب الحالية.注:在翻译中,“三维扫描”被翻译为“المسح新三维”,这可能是笔误。正确的翻译应该是“المسح ثلاثي الأبعاد”。以下是修正后的版本:أظهرت نموذج الشكل القابل للتغيير ثلاثي الأبعاد (3DMM)، وهو نموذج إحصائي يعتمد على تحليل المكونات الرئيسية (PCA) ويستخدم دوال أساسية خطية لتمثيل الوجه ثلاثي الأبعاد، نتائج واعدة في إعادة بناء الوجوه ثلاثية الأبعاد من صور ملتقطة بشكل عشوائي من زاوية واحدة. ومع ذلك، فإن قوة تمثيل 3DMM محدودة بسبب العدد المحدود للمسح ثلاثي الأبعاد والأساس الخطي العالمي. لمعالجة هذه القيود، نقترح طريقة تعتمد على التعلم بسيطة تقوم بإعادة بناء شبكة الوجه ثلاثية الأبعاد لأول مرة باستخدام تشويه حر (FFD). يعتبر FFD طريقة نمذجة هندسية تدمج شبكة مرجعية داخل شبكة متوازية المستطيلات وتتشوه الشبكة عن طريق تحريك نقاط التحكم النادرة في الشبكة. بما أن FFD يعتمد على دوال أساسية معرفة رياضياً، فإنه لا يواجه أي قيود في قوة التمثيل. وبالتالي، يمكننا استعادة شبكات الوجه ثلاثية الأبعاض بدقة عن طريق تقدير الانحراف المناسب لنقاط التحكم كمعلمات تشويه. رغم أن كل من 3DMM وFFD هما نماذج معلمية، إلا أنه من الصعب التنبؤ بتأثير معالم 3DMM على شكل الوجه، بينما تكون معالم التشويه في FFD قابلة للتفهم فيما يتعلق بتأثيرها على الشكل النهائي للشبكة. هذا الميزة العملية لـ FFD تسمح لأن تكون الشبكة الناتجة ونقاط التحكم نقطة بداية جيدة لنمذجة الوجه ثلاثي الأبعاض، حيث يمكن للمستخدمين العاديين ضبط الشبكة بدقة باستخدام أدوات البرمجيات ثلاثية الأبعاض المتاحة على نطاق واسع. أظهرت التجارب التي أجريت على عدة مجموعات بيانات كيف أن طرحتنا تقدر بنجاح هندسة الوجه الثلاثي الأبعاض والتعبيرات الوجهية من صور الوجه ثنائية الأبعاض، مما حقق أداءً مشابهاً لأفضل الأساليب الحالية.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp