ADCrowdNet: شبكة تلافيفية قابلة للتشويه مع انتباه مُحقَّق لفهم الجموع

نقترح شبكة تلافيفية قابلة للتشوه ذات انتباه مُحقَّق تسمى ADCrowdNet لفهم الحشود، والتي يمكنها معالجة مشكلة انخفاض الدقة في المشاهد المزدحمة والضوضائية للغاية. تحتوي ADCrowdNet على شبكتين متتاليتين. الشبكة الأولى، التي تُعرف باسم جهاز إنشاء الخريطة الانتباهية (Attention Map Generator - AMG)، تقوم بتحديد مناطق الحشود في الصور وحساب درجة الزحام في هذه المناطق. بناءً على المناطق المحددة للحشود وأولويات الزحام، تقوم الشبكة القابلة للتشوه متعددة المقاييس، التي تُعرف باسم جهاز تقدير الخريطة الكثافة (Density Map Estimator - DME)، بإنشاء خرائط كثافة عالية الجودة. باستخدام نظام التدريب الانتباهي ومخطط التلافيف المتعدد المقاييس، تحقق الشبكة المقترحة ADCrowdNet القدرة على التقاط خصائص الحشود بشكل أكثر فعالية ومقاومة أنواع مختلفة من الضوضاء بشكل أفضل. لقد قمنا بتقييم طريقتنا على أربعة مجموعات بيانات شائعة لعد الحشود (ShanghaiTech، UCF_CC_50، WorldEXPO'10، وUCSD) وعلى مجموعة بيانات إضافية لعد السيارات TRANCOS، وقد تفوقت طريقتنا على الأساليب الرائدة حاليًا في جميع هذه المجموعات البيانات.