Réseau de Détection d'Instances Multiples avec Affinage en Ligne du Classifieur d'Instances

Récemment, la détection d'objets faiblement supervisée a acquis une grande importance dans le domaine de la reconnaissance d'objets. Grâce à l'apprentissage profond, les détecteurs faiblement supervisés ont obtenu de nombreux résultats prometteurs. Cependant, par rapport à la détection pleinement supervisée, il est plus difficile d'entraîner des détecteurs basés sur des réseaux profonds de manière faiblement supervisée. Dans cet article, nous formulons la détection faiblement supervisée comme un problème d'apprentissage par apprentissage multi-instance (MIL), où les classifieurs d'instances (détecteurs d'objets) sont intégrés au réseau en tant que nœuds cachés. Nous proposons un nouvel algorithme de raffinement en ligne des classifieurs d'instances pour intégrer le MIL et la procédure de raffinement des classifieurs d'instances dans un seul réseau profond, et entraîner ce réseau bout-à-bout avec une supervision au niveau des images uniquement, c'est-à-dire sans informations sur l'emplacement des objets. Plus précisément, les étiquettes d'instances inférées à partir de la supervision faible sont propagées vers leurs instances spatialement superposées pour raffiner en ligne le classifieur d'instances. La procédure itérative de raffinement des classifieurs d'instances est mise en œuvre à l'aide de plusieurs flux dans le réseau profond, où chaque flux supervise son flux ultérieur. Des expériences de détection d'objets faiblement supervisée ont été réalisées sur les benchmarks difficiles PASCAL VOC 2007 et 2012. Nous obtenons un mAP de 47% sur VOC 2007, ce qui dépasse considérablement l'état de l'art précédent.Note : - "mAP" est généralement conservé tel quel en français car c'est un terme technique couramment utilisé.- "PASCAL VOC" est également conservé tel quel car c'est le nom officiel du benchmark.