إعادة التفكير في التثبيت المكاني للشبكات التلافيفية لعدّ الكائنات

تعتبر الدراسات السابقة أن تحسين التماثل المكاني للشبكات التلافيفية هو المفتاح لعدّ الكائنات. ومع ذلك، وبعد التحقق من عدة شبكات عدّ رئيسية، اكتشفنا بشكل مفاجئ أن التماثل المكاني على مستوى البكسل بشكل صارم قد يؤدي إلى تضخم الضوضاء في توليد خريطة الكثافة. في هذه الورقة، نحاول استخدام نوى جاوسية متصلة محليًا بدلًا من مرشح التلافيف الأصلي لتقدير الموضع المكاني في خريطة الكثافة. والهدف من ذلك هو تمكين عملية استخلاص الميزات من تحفيز عملية توليد خريطة الكثافة، بهدف التغلب على ضوضاء التسمية. مستوحين من أعمال سابقة، نقترح تقريبًا من الدرجة المنخفضة مصحوبًا بالتماثل الترجمي، لتنفيذ تقريب فعّال للتحويل التلافيفي الجاوسي الضخم. تشير أبحاثنا إلى اتجاه جديد للبحث اللاحق، والذي يجب أن يركز على كيفية تخفيف التماثل المكاني على مستوى البكسل بشكل مفرط في مهام عدّ الكائنات. تم تقييم طريقة العمل لدينا على أربع شبكات رئيسية لعدّ الكائنات (أي MCNN وCSRNet وSANet وResNet-50). وتم إجراء تجارب واسعة على سبعة معايير شهيرة لثلاث تطبيقات (أي عدّ الحشود، والمركبات، والنباتات). أظهرت نتائج التجارب أن طريقة العمل لدينا تتفوق بشكل ملحوظ على الطرق الرائدة الأخرى، وتحقق تعلمًا واعدًا للموضع المكاني للكائنات.