Détection Précise dans des Scènes Densément Remplies

Les scènes artificielles peuvent être très denses, contenant de nombreux objets, souvent identiques, positionnés en proximité étroite. Nous montrons que la détection précise des objets dans de telles scènes reste un domaine de recherche difficile même pour les détecteurs d'objets les plus avancés actuellement disponibles. Nous proposons une nouvelle méthode basée sur l'apprentissage profond pour la détection précise des objets, conçue spécifiquement pour ces configurations complexes. Nos contributions incluent :1. Une couche pour estimer l'indice de Jaccard comme score de qualité de détection ;2. Un module de fusion EM (Expectation-Maximization) novateur, qui utilise nos scores de qualité pour résoudre les ambiguïtés liées aux chevauchements de détection ;3. Un ensemble de données annoté exhaustif, SKU-110K, représentant des environnements commerciaux denses, mis à disposition pour l'entraînement et le test sous ces conditions extrêmes.Les tests de détection sur SKU-110K et les tests de comptage sur CARPK et PUCPR+ montrent que notre méthode surpasser largement les méthodes existantes les plus performantes. Le code source et les données seront rendus disponibles sur \url{www.github.com/eg4000/SKU110K_CVPR19}.