تموضع الوجه بدقة ميكروثانية واحدة باستخدام مجموعة من أشجار الانحدار

يتناول هذا البحث مشكلة تثبيت الوجه في صورة واحدة. نُظهر كيف يمكن استخدام مجموعة من أشجار الانحدار (ensemble of regression trees) لتقدير مواقع نقاط المرجع الوجهية مباشرةً من مجموعة نادرة من قيم شدة البكسل، مما يحقق أداءً فائق السرعة مع تنبؤات عالية الجودة. نقدم إطارًا عامًا مبنيًا على تحسين التدرج (gradient boosting) لتعلم مجموعة من أشجار الانحدار التي تُحسّن دالة الخسارة المربعة المجمعة، وتعمل بشكل طبيعي مع البيانات المفقودة أو الجزئيّة التسمية. نُوضح كيف تساعد استخدام الاحتمالات المناسبة التي تستغل البنية الهيكلية للبيانات الصورية في اختيار الميزات بشكل فعّال. كما نستعرض استراتيجيات الت régularisation المختلفة ونُحلّل أهميتها في مواجهة التعلّم الزائد (overfitting). بالإضافة إلى ذلك، نُحلّل تأثير كمية بيانات التدريب على دقة التنبؤات، ونستكشف تأثير تعزيز البيانات باستخدام بيانات مُولّدة صناعيًا.