Détection d'objets hors contexte à l'aide de indices contextuels

Cet article présente une méthode pour détecter les objets hors contexte (OOC) dans une image. Étant donné une image contenant un ensemble d’objets, notre objectif consiste à déterminer si un objet est incohérent par rapport au contexte scénique et à localiser cet objet OOC à l’aide d’une boîte englobante. Dans cette étude, nous considérons des relations contextuelles couramment explorées, telles que les relations de co-occurrence, la taille relative d’un objet par rapport aux autres objets, ainsi que la position de l’objet dans la scène. Nous supposons que les indices contextuels sont utiles pour déterminer les étiquettes des objets présents dans le contexte, tandis que des indices contextuels incohérents nuisent à l’attribution correcte des étiquettes aux objets hors contexte. Pour réaliser cette hypothèse, nous proposons un réseau de raisonnement contextuel basé sur les graphes (GCRN) afin de détecter les objets OOC. Le GCRN se compose de deux graphes distincts permettant de prédire les étiquettes des objets à partir des indices contextuels présents dans l’image : 1) un graphe de représentation, qui apprend les caractéristiques des objets en fonction de leurs voisins, et 2) un graphe contextuel, qui capte explicitement les indices contextuels provenant des objets voisins. Le GCRN capture de manière explicite les indices contextuels afin d’améliorer la détection des objets dans le contexte et d’identifier les objets qui violent les relations contextuelles. Afin d’évaluer notre approche, nous avons construit un grand jeu de données en ajoutant des instances d’objets OOC aux images du dataset COCO. Nous avons également effectué des évaluations sur une base de benchmark récente dédiée à la détection des objets hors contexte (OCD). Nos résultats montrent que le GCRN surpasser les méthodes de référence existantes en matière de détection des objets OOC ainsi que de détection correcte des objets dans le contexte.