HyperAIHyperAI
منذ 11 أيام

عدّ الحشود والتحديد الفردي باستخدام تسمية مربعة اصطناعية

{Kwangho Song, Jihye Ryu}
الملخص

تركز الدراسات الحديثة في عد الحشود على عد الأفراد المكتشفين بدلاً من تقدير عدد الأشخاص في الصورة. ومع ذلك، فإن الطرق الحالية لتحديد مواقع الحشود تقوم بالكشف المباشر عن نقاط الرأس أو مناطق الأفراد، مما قد يؤدي إلى نتائج غير مسؤولة عندما تقع النقاط خارج الشبكة المحددة. تقدم الشبكة المقترحة، وهي شبكة التسمية المربعة الظاهرية (PSL-Net)، طريقة جديدة لعد الحشود وتحديد مواقعها، وتستفيد من طريقة الكشف الخالية من المُعلّقات (anchor-free)، حيث تقوم PSL-Net بتوقع احتمال أن يقع نقطة الوسط داخل الشبكة المسؤولة، بينما تكشف بشكل غير مباشر عن الأفراد الخارجين عن الشبكة المسؤولة من خلال الانحدار على الصندوق (box regression) وتقدير المركزية (centerness). وتقترح هذه الدراسة استخدام تسمية مربعة افتراضية (PSL) كوسيلة للإشراف، والتي تُنشأ حول التسمية النقطية بحجم ثابت. علاوةً على ذلك، تم تصميم خوارزمية تطابق جزئية من نوع "عدة إلى واحد" (partial many-to-one matching) لتخصيص التسميات الدقيقة من خلال التطابق فقط داخل منطقة PSL أثناء مرحلة التدريب، وربط النقاط المُتنبأ بها بشبكتها المسؤولة من خلال مقياس المركزية أثناء مرحلة الاستنتاج. في النتيجة، لم تحقق PSL-Net أفضل الأداء في مستوى الحالة الحالية (state-of-the-art) على مجموعتي بيانات شانغهاي تك بارت أ و ب، اللتين تعدان من أكثر مجموعات البيانات شيوعاً في مجال عد الحشود، بل وحققت أيضًا أفضل النتائج بين الطرق القائمة على كشف النقاط في مجال تحديد مواقع الحشود.

عدّ الحشود والتحديد الفردي باستخدام تسمية مربعة اصطناعية | أحدث الأوراق البحثية | HyperAI