Réseaux de neurones convolutionnels sensibles aux sous-catégories pour les propositions d'objets et la détection

Dans les méthodes de détection d'objets basées sur les CNN (Convolutional Neural Networks), la proposition de régions devient une bouteille d'étranglement lorsque les objets présentent des variations importantes d'échelle, des occultations ou des troncatures. De plus, ces méthodes se concentrent principalement sur la détection d'objets en 2D et ne peuvent pas estimer les propriétés détaillées des objets. Dans cet article, nous proposons des CNNs sensibles aux sous-catégories pour la détection d'objets. Nous introduisons un nouveau réseau de proposition de régions qui utilise des informations sur les sous-catégories pour guider le processus de génération de propositions, ainsi qu'un nouveau réseau de détection pour la détection conjointe et la classification des sous-catégories. En utilisant des sous-catégories liées à la posture des objets, nous obtenons des performances de pointe tant en détection qu'en estimation de posture sur les benchmarks couramment utilisés.