تعلم التحويل الحر للتشوه لاستعادة الوجه ثلاثي الأبعاد من الصور البرية

أظهرت نموذج الشكل القابل للتغيير ثلاثي الأبعاد (3DMM)، وهو نموذج إحصائي يعتمد على تحليل المكونات الرئيسية (PCA) ويستخدم دوال أساسية خطية لتمثيل الوجه ثلاثي الأبعاد، نتائج واعدة في إعادة بناء الوجوه ثلاثية الأبعاد من صور ملتقطة بشكل عشوائي من زاوية واحدة. ومع ذلك، فإن قوة تمثيل 3DMM محدودة بسبب العدد المحدود للمسح新三维 (3D scans) والأساس الخطي العالمي. لمعالجة هذه القيود، نقترح طريقة تعتمد على التعلم بسيطة تقوم بإعادة بناء شبكة الوجه ثلاثية الأبعاد لأول مرة باستخدام تشويه حر (FFD). يعتبر FFD طريقة نمذجة هندسية تدمج شبكة مرجعية داخل شبكة متوازية المستطيلات وتتشوه الشبكة عن طريق تحريك نقاط التحكم النادرة في الشبكة. بما أن FFD يعتمد على دوال أساسية معرفة رياضياً، فإنه لا يواجه أي قيود في قوة التمثيل. وبالتالي، يمكننا استعادة شبكات الوجه ثلاثية الأبعاد بدقة عن طريق تقدير الانحراف المناسب لنقاط التحكم كمعلمات تشويه. رغم أن كل من 3DMM وFFD هما نماذج معلمية، إلا أنه من الصعب التنبؤ بتأثير معالم 3DMM على شكل الوجه، بينما تكون معالم التشويه في FFD قابلة للتفهم فيما يتعلق بتأثيرها على الشكل النهائي للشبكة. هذا الميزة العملية لـ FFD تسمح لأن تكون الشبكة الناتجة ونقاط التحكم نقطة بداية جيدة لنمذجة الوجه ثلاثي الأبعاد، حيث يمكن للمستخدمين العاديين ضبط الشبكة بدقة باستخدام أدوات البرمجيات ثلاثية الأبعاد المتاحة على نطاق واسع. أظهرت التجارب التي أجريت على عدة مجموعات بيانات كيف أن طرحتنا تقدر بنجاح هندسة الوجه الثلاثي الأبعاد والتعبيرات الوجهية من صور الوجه ثنائية الأبعاد، مما حقق أداءً مشابهاً لأفضل الأساليب الحالية.注:在翻译中,“三维扫描”被翻译为“المسح新三维”,这可能是笔误。正确的翻译应该是“المسح ثلاثي الأبعاد”。以下是修正后的版本:أظهرت نموذج الشكل القابل للتغيير ثلاثي الأبعاد (3DMM)، وهو نموذج إحصائي يعتمد على تحليل المكونات الرئيسية (PCA) ويستخدم دوال أساسية خطية لتمثيل الوجه ثلاثي الأبعاد، نتائج واعدة في إعادة بناء الوجوه ثلاثية الأبعاد من صور ملتقطة بشكل عشوائي من زاوية واحدة. ومع ذلك، فإن قوة تمثيل 3DMM محدودة بسبب العدد المحدود للمسح ثلاثي الأبعاد والأساس الخطي العالمي. لمعالجة هذه القيود، نقترح طريقة تعتمد على التعلم بسيطة تقوم بإعادة بناء شبكة الوجه ثلاثية الأبعاد لأول مرة باستخدام تشويه حر (FFD). يعتبر FFD طريقة نمذجة هندسية تدمج شبكة مرجعية داخل شبكة متوازية المستطيلات وتتشوه الشبكة عن طريق تحريك نقاط التحكم النادرة في الشبكة. بما أن FFD يعتمد على دوال أساسية معرفة رياضياً، فإنه لا يواجه أي قيود في قوة التمثيل. وبالتالي، يمكننا استعادة شبكات الوجه ثلاثية الأبعاض بدقة عن طريق تقدير الانحراف المناسب لنقاط التحكم كمعلمات تشويه. رغم أن كل من 3DMM وFFD هما نماذج معلمية، إلا أنه من الصعب التنبؤ بتأثير معالم 3DMM على شكل الوجه، بينما تكون معالم التشويه في FFD قابلة للتفهم فيما يتعلق بتأثيرها على الشكل النهائي للشبكة. هذا الميزة العملية لـ FFD تسمح لأن تكون الشبكة الناتجة ونقاط التحكم نقطة بداية جيدة لنمذجة الوجه ثلاثي الأبعاض، حيث يمكن للمستخدمين العاديين ضبط الشبكة بدقة باستخدام أدوات البرمجيات ثلاثية الأبعاض المتاحة على نطاق واسع. أظهرت التجارب التي أجريت على عدة مجموعات بيانات كيف أن طرحتنا تقدر بنجاح هندسة الوجه الثلاثي الأبعاض والتعبيرات الوجهية من صور الوجه ثنائية الأبعاض، مما حقق أداءً مشابهاً لأفضل الأساليب الحالية.