Détection d'Objets Cachés

Nous présentons la première étude systématique sur la détection d'objets cachés (COD), qui vise à identifier des objets « parfaitement » intégrés dans leur environnement. Les fortes similitudes intrinsèques entre les objets cachés et leur arrière-plan rendent la COD bien plus complexe que la détection ou le segmention traditionnelles d'objets. Pour mieux comprendre cette tâche, nous avons constitué un jeu de données à grande échelle, appelé COD10K, composé de 10 000 images couvrant des objets cachés dans diverses situations réelles issues de 78 catégories d'objets. De plus, nous fournissons des annotations riches, incluant les catégories d'objets, les contours des objets, les attributs difficiles, les étiquettes au niveau objet et les annotations au niveau instance. Notre COD10K est actuellement le plus grand jeu de données en COD, avec les annotations les plus complètes, ce qui permet une compréhension exhaustive des objets cachés et peut même être utilisé pour faire progresser plusieurs autres tâches visuelles telles que la détection, le segmention et la classification. Inspirés par la manière dont les animaux chassent dans la nature, nous avons également conçu une ligne de base simple mais puissante pour la COD, nommée le Réseau de Recherche et d'Identification (SINet). Sans recourir à des techniques complexes ou superflues, SINet surpasses 12 lignes de base de pointe sur tous les jeux de données testés, ce qui en fait des architectures robustes et générales pouvant servir de catalyseurs pour des recherches futures en COD. Enfin, nous présentons quelques résultats intéressants et soulignons plusieurs applications potentielles et directions futures. Pour stimuler la recherche dans ce nouveau domaine, notre code source, notre jeu de données et notre démonstration en ligne sont disponibles sur notre page du projet : http://mmcheng.net/cod.