Étiquetage d'instances avec prise en compte des objets pour la détection d'objets faiblement supervisée

La détection d'objets faiblement supervisée (WSOD), où un détecteur est formé uniquement avec des annotations au niveau de l'image, attire de plus en plus l'attention. En tant que méthode pour obtenir un détecteur performant, le détecteur et les étiquettes d'instances sont mis à jour itérativement. Dans cette étude, afin d'améliorer l'efficacité de la mise à jour itérative, nous nous concentrons sur le problème d'étiquetage d'instances, qui consiste à déterminer quelle étiquette doit être attribuée à chaque région en fonction du dernier résultat de localisation. Au lieu d'étiqueter simplement la région ayant le score le plus élevé et ses régions fortement chevauchantes comme positives et les autres comme négatives, nous proposons des méthodes d'étiquetage d'instances plus efficaces, telles que :Premièrement, pour résoudre le problème selon lequel les régions ne couvrant qu'une partie de l'objet ont tendance à être étiquetées comme positives, nous identifions les régions couvrant l'objet entier en mettant l'accent sur la perte de classification contextuelle.Deuxièmement, en tenant compte des situations où les autres objets contenus dans l'image peuvent être étiquetés comme négatifs, nous imposons une restriction spatiale aux régions étiquetées comme négatives.En utilisant ces méthodes d'étiquetage d'instances, nous formons le détecteur sur les jeux de données PASCAL VOC 2007 et 2012 et obtenons des résultats significativement améliorés par rapport aux autres approches de pointe.