GhostVLAD للتعرف على الوجه المستند إلى المجموعات

هدف هذه الورقة هو تعلم تمثيل مضغوط لمجموعات الصور للاعتراف بالوجه القائم على النماذج. نقدم المساهمات التالية: أولاً، نقترح هندسة شبكة تقوم بتجميع ودمج وصفيات الوجه التي تنتجها الشبكات العصبية التلافيفية العميقة في تمثيل مضغوط ذو طول ثابت. هذا التمثيل المضغوط يتطلب تخزين ذاكرة قليل للغاية ويتيح حساب التشابه بكفاءة عالية. ثانياً، نقترح طبقة GhostVLAD جديدة تتضمن {\em مجموعات شبح} لا تسهم في التجميع. نوضح أن وزن جودة يظهر تلقائيًا على الوجوه المدخلة بحيث تسهم الصور المعلوماتية أكثر من تلك ذات الجودة المنخفضة، وأن المجموعات الشبحية تعزز قدرة الشبكة على التعامل مع الصور ذات الجودة السيئة. ثالثاً، نستكشف كيف يؤثر بُعد الخصائص المدخلة، عدد المجموعات وتقنيات التدريب المختلفة على أداء الاعتراف. بناءً على هذا التحليل، نقوم بتدريب شبكة تتفوق بشكل كبير على الحالة الحالية للتقنية في مجموعة بيانات IJB-B للاعتراف بالوجه. هذه هي واحدة من أكثر المقاييس العامة تحديًا حاليًا، وقد تفوقنا على الحالة الحالية للتقنية في بروتوكولات التعرف والتحقق منها.