HyperAIHyperAI
منذ 17 أيام

بيتا ر-سي أن: النظر في الكشف عن المشاة من منظور آخر

Zixuan Xu, Banghuai Li, Ye Yuan, Anhong Dang
بيتا ر-سي أن: النظر في الكشف عن المشاة من منظور آخر
الملخص

تم تحقيق تقدم كبير مؤخرًا في كشف المشاة، إلا أن تحقيق أداء عالٍ في المشاهد المزدحمة والمشاهد التي تشهد تداخلًا (تغطية جزئية) لا يزال يمثل تحديًا كبيرًا. ويمكن تفسير هذا التحدي في المقام الأول بالتمثيل الشائع المستخدم للمشاة، وهو المربع المحيط بمحاذاة محوري 2D، والذي يصف فقط الموقع التقريبي والحجم الكلي للجسم. حيث يُمثّل هذا المربع الجسم كتوزيع منتظم داخل حدوده، مما يجعل المشاة غير قابلين للتمييز في المشاهد المزدحمة أو المغطاة جزئيًا بسبب وجود ضجيج كبير. وللتغلب على هذه المشكلة، نقترح تمثيلًا جديدًا يعتمد على التوزيع البيتا ثنائي الأبعاد، ويُسمّى تمثيل البيتا (Beta Representation). يُصوّر هذا التمثيل المشاة من خلال بناء علاقة صريحة بين المربع المحيط الكامل والمربع المرئي، مع التركيز على مركز الكتلة البصرية من خلال تخصيص قيم احتمالية مختلفة للبكسلات. وبذلك، يُظهر تمثيل البيتا أداءً أفضل بكثير في التمييز بين الكائنات المتشابكة بشدة في المشاهد المزدحمة، وذلك بفضل استراتيجية جديدة لـ NMS تُسمّى BetaNMS. علاوةً على ذلك، للاستفادة الكاملة من تمثيل البيتا، تم اقتراح مسار جديد يُدعى Beta R-CNN، مزودًا بـ BetaHead وBetaMask، مما يؤدي إلى أداء عالٍ في كشف المشاة في المشاهد المغطاة جزئيًا أو المزدحمة.