شبكة تجميع المقياس للعد الدقيق والكفاءة في الازدحام

في هذه الورقة، نقترح شبكة مشفرة-فك مشفرة جديدة تُسمى شبكة تجميع المقياس (SANet)، لتقدير عدد الحشود بدقة وكفاءة. يُستخرج من خلال الجزء المشفر ميزات متعددة المقياس باستخدام وحدات تجميع المقياس، بينما يُولِّد الجزء فك التشفير خرائط كثافة عالية الدقة باستخدام مجموعة من التحويلات العكسية (transposed convolutions). بالإضافة إلى ذلك، نلاحظ أن معظم الدراسات السابقة تستخدم فقط دالة الخسارة الإقليدية (Euclidean loss)، التي تفترض استقلالية كل بكسل عن الآخر، وتجاهل الترابط المحلي في خرائط الكثافة. ولذلك، نقترح دالة خسارة تدريب جديدة تجمع بين دالة الخسارة الإقليدية ودالة الاتساق النمطي المحلي، مما يُحسّن أداء النموذج في تجاربنا. علاوة على ذلك، نستخدم طبقات التطبيع (normalization layers) لتيسير عملية التدريب، ونطبّق خطة اختبار قائمة على القطع (patch-based test scheme) لتقليل تأثير مشكلة الانزياح الإحصائي. ولإثبات فعالية الطريقة المقترحة، أجرينا تجارب واسعة على أربع مجموعات بيانات رئيسية لتقدير عدد الحشود، وقد أظهرت النتائج تفوق طريقة لدينا على الطرق الحالية المتطورة، مع عدد أقل بكثير من المعاملات (المعلمات).