توافق التوزيع للعدّ الجماعي

في حساب الحشود، تحتوي كل صورة تدريبية على عدد كبير من الأشخاص، حيث يتم وضع علامة نقطية على كل شخص. تعتمد الطرق الحالية لحساب الحشود على استخدام توزيع غاوسي لتنعيم كل نقطة مُعلَّمة أو لتقدير احتمالية كل بكسل بناءً على النقطة المُعلَّمة. في هذه الورقة، نُظهر أن تطبيق توزيع غاوسي على العلامات يُضعف أداء التعميم. بدلًا من ذلك، نقترح استخدام تقنية تُسمى "مطابقة التوزيع لحساب الحشود" (DM-Count). في DM-Count، نستخدم نقل الأمثل (Optimal Transport - OT) لقياس التشابه بين خريطة الكثافة المُقدَّرة المُعدَّلة وخرائط الكثافة الحقيقية المُعدَّلة. ولتحسين استقرار حسابات OT، نُضَمّن خسارة التباين الكلي (Total Variation loss) في نموذجنا. ونُظهر أن حد الخطأ في التعميم لـ DM-Count يكون أضيق من حدود الطرق التي تعتمد على تمويه غاوسي. من حيث متوسط الخطأ المطلق، تتفوّق DM-Count على أحدث الطرق المنشورة على مجموعتي بيانات كبيرتي الحجم UCF-QNRF وNWPU بفارق كبير، وتحقق أفضل النتائج على مجموعتي بيانات شانغهاي تك وUCF-CC50. كما أن DM-Count قلّصت خطأ النتائج المنشورة الأفضل في المجال بنسبة تقارب 16%. يمكن الوصول إلى الكود عبر الرابط: https://github.com/cvlab-stonybrook/DM-Count.