Pedestrian-Synthesis-GAN: توليد بيانات المشاة في البيئة الحقيقية وما بeyond ذلك

حققت نماذج الكشف عن المشاة المتطورة نجاحًا كبيرًا في العديد من المقاييس. ومع ذلك، تتطلب هذه النماذج الكثير من المعلومات المصحوبة بالتعليقات والعملية التصنيفية عادة ما تستغرق وقتًا وجهدًا كبيرين. في هذا البحث، نقترح طريقة لتوليد بيانات مشاة مصحوبة بالتعليقات وتكيفها لدعم تدريب كاشفات المشاة. يُبنى الإطار المقترح على شبكة التوليد التنافسية (Generative Adversarial Network - GAN) مع عدة مميزات، بهدف تركيب مشاة واقعية وتعلم سياق الخلفية في الوقت نفسه. للتعامل مع المشاة بحجم مختلف، نعتمد طبقة التجميع الهرمي المكاني (Spatial Pyramid Pooling - SPP) في المميز. أجرينا تجارب على مقاييسين. أظهرت النتائج أن إطارنا قادر على تركيب المشاة بسلاسة على صور خلفيات متغيرة ومختلفة المستويات من التفاصيل. لتقييم نهجنا بشكل كمي، أضفنا العينات المركبة إلى بيانات التدريب لكاشفات المشاة الأساسية وأظهرنا أن الصور التركيبية قادرة على تحسين أداء الكاشفات.