A-Fast-RCNN : Génération de Positifs Difficiles par un Adversaire pour la Détection d'Objets

Comment apprenons-nous un détecteur d'objets invariant aux occultations et aux déformations ? Notre solution actuelle consiste à utiliser une stratégie basée sur les données -- collecter des ensembles de données à grande échelle comportant des instances d'objets dans différentes conditions. L'espoir est que le classifieur final puisse utiliser ces exemples pour apprendre des invariances. Mais est-il vraiment possible de voir toutes les occultations dans un ensemble de données ? Nous soutenons que, comme les catégories, les occultations et les déformations d'objets suivent également une distribution à queue longue (long-tail). Certaines occultations et déformations sont si rares qu'elles se produisent à peine ; néanmoins, nous souhaitons apprendre un modèle invariant face à de tels événements. Dans cet article, nous proposons une solution alternative. Nous suggérons d'apprendre un réseau antagoniste qui génère des exemples avec des occultations et des déformations. L'objectif de l'adversaire est de générer des exemples difficiles pour le détecteur d'objets à classifier. Dans notre cadre, le détecteur initial et l'adversaire sont appris conjointement. Nos résultats expérimentaux indiquent une amélioration de 2,3 % du mAP sur la tâche de détection d'objets VOC07 et de 2,6 % du mAP sur la tâche de détection d'objets VOC2012 par rapport au pipeline Fast-RCNN. Nous mettons également le code source de cet article à disposition.注释:- "long-tail" 被翻译为 "distribution à queue longue",这是在法语文献中常见的表达方式。- "mAP" 保持不变,因为这是衡量目标检测性能的常用指标。- "Fast-RCNN pipeline" 被翻译为 "pipeline Fast-RCNN",以保持技术术语的专业性。