Réseau de blocs conscient du contexte pour la détection d'objets de petite taille
Les détecteurs d'objets de pointe s'appuient généralement sur un échantillonnage progressif de l'image d'entrée jusqu'à ce qu'elle soit représentée par des cartes de caractéristiques de petite taille, ce qui entraîne une perte d'information spatiale et affaiblit la représentation des objets de petite taille. Dans cet article, nous proposons un réseau à blocs conscients du contexte (CAB Net) afin d'améliorer la détection des objets de petite taille en construisant des cartes de caractéristiques à haute résolution et à forte sémantique. Pour renforcer internement la capacité de représentation des cartes de caractéristiques à haute résolution spatiale, nous concevons avec soin le bloc conscient du contexte (CAB). Ce dernier exploite des convolutions dilatées pyramidales afin d'intégrer des informations contextuelles à plusieurs niveaux sans perdre la résolution d'origine des cartes de caractéristiques. Ensuite, nous intégrons le CAB à la fin d'un réseau principal tronqué (par exemple, VGG16) présentant un facteur d'échantillonnage relativement faible (par exemple, 8), tout en supprimant toutes les couches suivantes. Le CAB Net parvient ainsi à capturer à la fois les motifs visuels fondamentaux et les informations sémantiques propres aux objets de petite taille, améliorant ainsi les performances de détection. Des expériences menées sur les jeux de données de référence Tsinghua-Tencent 100K et Airport montrent que le CAB Net surpasse de manière significative d'autres détecteurs de haut niveau, tout en maintenant une vitesse en temps réel, ce qui démontre l'efficacité du CAB Net pour la détection des objets de petite taille.