Une solution pour la détection de produits dans des scènes densément empaquetées

Ce travail constitue une solution pour le jeu de données de scènes densément peuplées SKU-110k. Notre approche est une modification du Cascade R-CNN. Pour résoudre le problème, nous avons proposé une stratégie de découpage aléatoire (random crop) qui garantit que le taux d'échantillonnage et l'échelle d'entrée soient relativement suffisants, en opposition au découpage aléatoire classique. Nous avons également adopté certaines techniques et optimisé les hyperparamètres. Afin de saisir les caractéristiques essentielles des scènes densément peuplées, nous avons analysé les différentes étapes d'un détecteur et investigué les goulets d'étranglement qui limitent ses performances. En conséquence, notre méthode obtient un mAP de 58,7 sur l'ensemble de test de SKU-110k.