تعزيز التركيز الفيديسيالي للكشف عن معالم الوجه

أسفرت طرق التعلم العميق عن تحسينات كبيرة في أداء مهمة كشف معالم الوجه (FLD). ومع ذلك، لا يزال من الصعب اكتشاف المعالم في ظروف صعبة مثل تغييرات وضع الرأس، أو التعبيرات المبالغ فيها، أو الإضاءة غير المتوازنة، بسبب التباين العالي وقلة العينات. يمكن نسب هذه النقصان إلى عدم قدرة النموذج على الاستفادة بشكل فعال من المعلومات الهيكلية للوجه الموجودة في الصور المدخلة. لمعالجة هذا الأمر، نقترح تقنية تعزيز صورية جديدة مصممة خصيصًا لمهمة كشف معالم الوجه بهدف تحسين فهم النموذج لهياكل الوجه. لتحقيق الاستفادة الفعالة من التقنية الجديدة المقترحة، نستخدم آلية تدريب قائمة على بنية سيامية (Siamese) مع دالة خسارة تعتمد على التحليل المرتبط القواني (DCCA) لتحقيق التعلم الجماعي لتمثيلات الخصائص عالية المستوى من وجهتي نظر مختلفتين للصور المدخلة. بالإضافة إلى ذلك، نستخدم شبكة قائمة على متحول + CNN مع وحدة ساعة رملية مخصصة كعمود فقري متين لبنية السيامية. تظهر التجارب الواسعة أن نهجنا يتفوق على العديد من الأساليب الرائدة في مجالها عبر مجموعة متنوعة من قواعد البيانات المرجعية.