HyperAIHyperAI
منذ 2 أشهر

LFFD: كاشف الوجوه الخفيف والسريع للأجهزة الحوافية

Yonghao He; Dezhong Xu; Lifang Wu; Meng Jian; Shiming Xiang; Chunhong Pan
LFFD: كاشف الوجوه الخفيف والسريع للأجهزة الحوافية
الملخص

الكشف عن الوجه كتكنولوجيا أساسية لتطبيقات متنوعة، يتم دائمًا نشرها على أجهزة الحواف التي تتميز بذاكرة تخزين محدودة وقوة حوسبة منخفضة. يقدم هذا البحث مكتشف وجه خفيف وسريع (LFFD) للأجهزة الحوافية. الطريقة المقترحة خالية من الأهداف الثابتة وتنتمي إلى فئة الكشف ذات المرحلة الواحدة. تحديدًا، نعيد النظر في أهمية مجال الاستقبال (RF) ومجال الاستقبال الفعال (ERF) في سياق الكشف عن الوجه. في جوهر الأمر، يتم توزيع مجالات الاستقبال للخلايا العصبية في طبقة معينة بشكل منتظم في الصورة المدخلة وهذه المجالات هي "أهداف" طبيعية. من خلال الجمع بين أهداف RF ومدى خطوات RF المناسب، يمكن للطريقة المقترحة اكتشاف نطاق كبير من مقاييس الوجه المستمرة بنسبة تغطية 100٪ نظريًا. يحفز الفهم العميق للعلاقات بين ERF ومقاييس الوجه تصميم عمود فقري فعال للكشف ذي المرحلة الواحدة. يتميز العمود الفقري بثمانية فروع اكتشاف وطبقات مشتركة، مما يؤدي إلى حسابات فعالة. تم إجراء تجارب شاملة ومكثفة على مقاييس شائعة: WIDER FACE وFDDB. تم اقتراح مخطط تقييم جديد للمواقف الموجهة نحو التطبيق. تحت هذا المخطط الجديد، يمكن للطريقة المقترحة تحقيق دقة عالية (WIDER FACE Val/Test -- سهل: 0.910/0.896، متوسط: 0.881/0.865، صعب: 0.780/0.770؛ FDDB -- غير مستمر: 0.973، مستمر: 0.724). تم تقديم عدة منصات Hardware لتقييم كفاءة التشغيل. يمكن الحصول على سرعة استدلال سريعة (NVIDIA TITAN Xp: 131.45 إطارًا في الثانية عند دقة 640x480؛ NVIDIA TX2: 136.99 إطارًا في الثانية عند دقة 160x120؛ Raspberry Pi 3 Model B+: 8.44 إطارًا في الثانية عند دقة 160x120) مع حجم نموذج يبلغ 9 ميجابايت (MB).