تحسين الاتساق الزمني للكشف عن حيوية الوجه في الوقت الفعلي

في هذه الورقة، نركّز على تحسين نظام الكشف عن حيوية الوجه في الوقت الفعلي بهدف تعزيز أمن نظام التعرف على الوجه في المراحل اللاحقة. تعاني معظم الطرق القائمة على الإطارات الحالية من عدم اتساق التنبؤات عبر الزمن. ولحل هذه المشكلة، نقترح حلًا بسيطًا ولكن فعّالًا مبنيًا على اتساق الزمن. وبشكل محدد، في مرحلة التدريب، نُقدّم خسارة ذاتية للإشراف الزمني وخسارة اتساق الفئة إلى جانب خسارة التباديل اللوغاريتمية (softmax cross-entropy loss) لدمج قيد اتساق الزمن. وفي مرحلة النشر، نطوّر وحدة تقييم غير معلمية بدون تدريب لتقدير عدم اليقين بشكل تكيفي لتنعيم التنبؤات. علاوة على المنهجية الشائعة للتقييم، نقترح تقييمًا مبنيًا على مقاطع الفيديو لتلبية سيناريوهات أكثر واقعية. أظهرت التجارب الواسعة أن حلنا أكثر مقاومةً لعدة هجمات عرض عرضية في سيناريوهات مختلفة، وتفوّق بشكل كبير على الحالة الراهنة في عدة مجموعات بيانات عامة، بمعدل لا يقل عن 40٪ من حيث ACER. بالإضافة إلى ذلك، وبتكلفة حسابية أقل بكثير (بما يعادل 33٪ أقل من FLOPs)، يُقدّم حلنا إمكانات كبيرة لتطبيقات الوقت الفعلي ذات التأخير المنخفض.