HyperAIHyperAI
منذ 16 أيام

شبكة تجميع المقياس للعد الدقيق والكفاءة في الازدحام

{Zhipeng Wang, Xinkun Cao, Fei Su, Yanyun Zhao}
شبكة تجميع المقياس للعد الدقيق والكفاءة في الازدحام
الملخص

في هذه الورقة، نقترح شبكة مشفرة-فك مشفرة جديدة تُسمى شبكة تجميع المقياس (SANet)، لتقدير عدد الحشود بدقة وكفاءة. يُستخرج من خلال الجزء المشفر ميزات متعددة المقياس باستخدام وحدات تجميع المقياس، بينما يُولِّد الجزء فك التشفير خرائط كثافة عالية الدقة باستخدام مجموعة من التحويلات العكسية (transposed convolutions). بالإضافة إلى ذلك، نلاحظ أن معظم الدراسات السابقة تستخدم فقط دالة الخسارة الإقليدية (Euclidean loss)، التي تفترض استقلالية كل بكسل عن الآخر، وتجاهل الترابط المحلي في خرائط الكثافة. ولذلك، نقترح دالة خسارة تدريب جديدة تجمع بين دالة الخسارة الإقليدية ودالة الاتساق النمطي المحلي، مما يُحسّن أداء النموذج في تجاربنا. علاوة على ذلك، نستخدم طبقات التطبيع (normalization layers) لتيسير عملية التدريب، ونطبّق خطة اختبار قائمة على القطع (patch-based test scheme) لتقليل تأثير مشكلة الانزياح الإحصائي. ولإثبات فعالية الطريقة المقترحة، أجرينا تجارب واسعة على أربع مجموعات بيانات رئيسية لتقدير عدد الحشود، وقد أظهرت النتائج تفوق طريقة لدينا على الطرق الحالية المتطورة، مع عدد أقل بكثير من المعاملات (المعلمات).

شبكة تجميع المقياس للعد الدقيق والكفاءة في الازدحام | أحدث الأوراق البحثية | HyperAI