HyperAIHyperAI
منذ 17 أيام

V2F-Net: التحليل الصريح للكشف عن المشاة المُحجبين

Mingyang Shang, Dawei Xiang, Zhicheng Wang, Erjin Zhou
V2F-Net: التحليل الصريح للكشف عن المشاة المُحجبين
الملخص

الإغلاق يُعدّ تحديًا كبيرًا في كشف المشاة. في هذه الورقة، نقترح طريقة بسيطة وفعّالة تُسمّى V2F-Net، والتي تُفكّك بشكل صريح كشف المشاة المُغطّى إلى كشف المناطق المرئية وتقدير الجسم الكامل. يتكوّن V2F-Net من شبكتين فرعيتين: شبكة كشف المناطق المرئية (VDN) وشبكة تقدير الجسم الكامل (FEN). تسعى VDN إلى تحديد مواقع المناطق المرئية، بينما تقدّر FEN مربع الجسم الكامل استنادًا إلى مربع المنطقة المرئية. علاوةً على ذلك، لتحسين تقدير الجسم الكامل بشكل أكبر، نقترح وحدة جديدة تُسمّى EPM (وحدة مُتميّزة بالتمييز الجزئي باستخدام التضمين). من خلال مراقبة درجة الرؤية لكل جزء، تُشجّع الشبكة على استخلاص ميزات تحتوي على معلومات أساسية عن الأجزاء. نُظهر تأثيرية V2F-Net تجريبيًا من خلال إجراء عدة تجارب على مجموعتي بيانات صعبتين. حقّق V2F-Net مكاسب بنسبة 5.85% في AP على مجموعة بيانات CrowdHuman وتحسينًا بنسبة 2.24% في MR-2 على مجموعة CityPersons مقارنةً بالأساسية FPN. علاوةً على ذلك، فإن المكاسب المستمرة على كلا نوعي الكاشفين (الواحد المرحلة والمرحلتين) تُثبت قابلية تعميم طريقة العمل لدينا.