تحسين كشف الكائنات في الصور الفنية باستخدام نقل النمط فقط

على الرغم من التقدم الأخير في كشف الكائنات باستخدام الشبكات العصبية العميقة، تظل هذه الشبكات تواجه صعوبات في التعرف على الكائنات في الصور الفنية مثل اللوحات والرسومات. ويُعرف هذا التحدي بمشكلة التمثيل المتقاطع، والتي تنشأ جزئيًا من ميل الشبكات العصبية إلى تفضيل التعرف على نسيج الكائن على شكله. في هذا البحث، نقترح ونقيّم عملية لتدريب الشبكات العصبية على تحديد مواقع الكائنات — وبشكل خاص الأشخاص — في الصور الفنية. ونُنشئ مجموعة بيانات كبيرة للتدريب والتحقق من خلال تعديل صور مجموعة بيانات COCO باستخدام تقنية نقل الأسلوب AdaIn. تُستخدم هذه المجموعة لضبط دقيق لشبكة كشف الكائنات Faster R-CNN، والتي تُختبر بعد ذلك على مجموعة بيانات الاختبار الحالية People-Art. ويؤدي ذلك إلى تحسن كبير مقارنة بأفضل النتائج الحالية، ويُقدّم طريقًا جديدًا لبناء مجموعات بيانات لتدريب الشبكات العصبية على معالجة الصور الفنية.