HyperAIHyperAI
منذ 2 أشهر

نحو الكشف الدقيق عن معالم الوجه من خلال المتحولات المتسلسلة

Li, Hui ; Guo, Zidong ; Rhee, Seon-Min ; Han, Seungju ; Han, Jae-Joon
نحو الكشف الدقيق عن معالم الوجه من خلال المتحولات المتسلسلة
الملخص

النقاط المرجعية الدقيقة للوجه هي شروط أساسية للكثير من المهام المتعلقة بالوجوه البشرية. في هذا البحث، تم اقتراح كاشف نقاط مرجعية دقيقة للوجه يعتمد على المحولات المتسلسلة (Cascaded Transformers). لقد صاغنا اكتشاف النقاط المرجعية للوجه كمهمة تنبؤ إحداثي بحيث يمكن تدريب النموذج بشكل شامل (End-to-End). باستخدام الانتباه الذاتي في المحولات، يمكن لنموذجنا استغلال العلاقات البنيوية بين النقاط المرجعية بشكل جوهري، مما يفيد اكتشاف النقاط المرجعية في ظروف صعبة مثل الزوايا الكبيرة والاخفاء (Occlusion). خلال عملية التكرار المتسلسلة، يتمكن نموذجنا من استخراج الخصائص الصورية الأكثر صلة حول النقطة المرجعية المستهدفة للتنبؤ بالإحداثيات، بناءً على آلية الانتباه القابلة للتكييف (Deformable Attention Mechanism)، مما يؤدي إلى مواءمة أكثر دقة. بالإضافة إلى ذلك، نقترح محكماً جديداً يقوم بتحسين الخصائص الصورية ومواقع النقاط المرجعية في آن واحد. مع زيادة قليلة في عدد المعلمات، تتحسن أداء الاكتشاف بشكل أكبر. حقق نموذجنا أداءً رائداً جديدًا على عدة مقاييس معيارية لاكتشاف النقاط المرجعية للوجه، وأظهر قدرة تعميم جيدة في تقييم البيانات عبر المجموعات المختلفة.

نحو الكشف الدقيق عن معالم الوجه من خلال المتحولات المتسلسلة | أحدث الأوراق البحثية | HyperAI