العد الجماعي من خلال متابعة التوافق عبر المقياس العدواني

يُعدُّ عدُّ الحشود أو تقدير الكثافة مهمةً صعبة في رؤية الحاسوب نظرًا للتغيرات الكبيرة في الحجم، والتشوهات الناتجة عن الرؤية الواسعة، والاحتقان الشديد، وغيرها. تعاني الطرق الحالية عادةً من مشكلتين رئيسيتين: 1) تأثير متوسط النموذج في الشبكات العصبية المتعددة المقياس (CNNs) الناتج عن استخدام خسارة الانحدار L2 الشائعة؛ و2) التقدير غير المتناسق بين المدخلات ذات المقياس المختلفة. ولحل هذه المشكلات بشكل صريح، نقترح إطارًا جديدًا لعدّ الحشود (تقدير الكثافة) يُسمى "السعي التكافؤي المعاكس عبر المقياس" (Adversarial Cross-Scale Consistency Pursuit - ACSCP). من ناحية، نصمم شبكة ذات هيكل U-net لتوليد خريطة الكثافة من قطعة مدخل، ونستخدم خسارة تكافؤية (adversarial loss) لتقليل الحل في فضاء واقعي، وبالتالي تقليل التأثيرات الضبابية في تقدير خريطة الكثافة. ومن ناحية أخرى، نصمم منظمًا جديدًا للاتساق عبر المقياس يفرض أن مجموع عدد الحشود المستخلص من القطع الصغيرة (أي المقياس الصغير) يكون متسقًا مع العدد الإجمالي للمنطقة الناتجة عن اتحاد هذه القطع (أي المقياس الكبير). يتم دمج هذه الخسائر عبر خطة تدريب مشتركة، مما يساعد على تعزيز أداء تقدير الكثافة من خلال استكشاف أعمق للتعاون بين الهدفين. وقد أثبتت التجارب الواسعة على أربع معايير تجريبية فعالية الابتكارات المقترحة، بالإضافة إلى تفوقها على الأساليب السابقة.