CrowdHuman: معيار للكشف عن الإنسان في الحشد

شهد اكتشاف الإنسان تقدماً ملحوظاً في السنوات الأخيرة. ومع ذلك، لا يزال مشكلة التعتيم (occlusion) في اكتشاف الإنسان في بيئات مزدحمة للغاية بعيدة عن الحل. مما يزيد الأمر سوءًا، فإن السيناريوهات الجماعية ما زالت قليلة التمثيل في مقاييس الأداء الحالية للاكتشاف البشري. في هذا البحث، نقدم مجموعة بيانات جديدة تُسمى CrowdHuman بهدف تقييم أفضل للمكتشفات في السيناريوهات الجماعية. تحتوي مجموعة البيانات CrowdHuman على حجم كبير وتعتبر غنية بال Annotations وتحتوي على تنوع عالٍ. هناك إجمالي $470K$ حالة بشرية من المجموعات الفرعية للتدريب والتحقق، بمعدل حوالي $22.6$ شخصًا لكل صورة، مع وجود أنواع مختلفة من التعتيم في المجموعة. يتم تحديد كل حالة بشرية بصناديق حدودية للرأس، ومنطقة ظاهرة للإنسان، وجسم الإنسان الكامل. تم تقديم أداء القاعدة الأساسية لأنظمة الكشف المتقدمة على مجموعة بيانات CrowdHuman. تظهر نتائج التعميم بين المجموعات المختلفة لمجموعة بيانات CrowdHuman أداءً متقدمًا على المجموعات السابقة مثل Caltech-USA و CityPersons و Brainwash دون الحاجة إلى تقنيات إضافية معقدة. نأمل أن تكون مجموعتنا البيانات أساسًا متينًا وأن تسهم في تعزيز البحوث المستقبلية في مهام اكتشاف الإنسان.