التعلم متعدد الأمثلة على الميزات العميقة للكشف عن الكائنات المراقبة ضعيفًا مع تغيرات نطاق قصوى

جذبت الكشف عن الكائنات المُدرَّسة بشكل ضعيف (WSOD) باستخدام علامات توضيحية على مستوى الصورة فقط انتباهًا متزايدًا على مدار السنوات القليلة الماضية. في حين يتم عادةً معالجة هذه المهمة باستخدام حلول مخصصة للمجال تركز على الصور الطبيعية، نُظهر أن نهجًا بسيطًا يعتمد على المجموعة المتعددة للوحدات، عند تطبيقه على ميزات عميقة مُدرَّبة مسبقًا، يُحقق أداءً ممتازًا على مجموعات بيانات غير فوتوغرافية، وقد يشمل فئات جديدة. لا يحتوي هذا النهج على أي تدريب دقيق (fine-tuning) أو تعلم عبر المجالات، وبالتالي فهو فعّال وقابل للتطبيق على مجموعات بيانات وفئات مختلفة بشكل عام. نستعرض عدة أشكال من النهج المقترح، بما في ذلك بعضها الذي يعتمد على الشبكات العصبية متعددة الطبقات (multi-layer perceptron) وال classifiers متعددة الوجوه (polyhedral classifiers). وعلى الرغم من بساطته، يُظهر نهجنا نتائج تنافسية على مجموعة متنوعة من مجموعات البيانات العامة المتاحة، بما في ذلك اللوحات الفنية (People-Art، IconArt)، والألوان المائية، والرسوم التوضيحية، والقصص المصورة، ويُمكّن من تعلّم فئات بصرية غير معروفة بشكل سريع.