Au-delà de la boîte englobante : adaptation des caractéristiques par enveloppe convexe pour la détection d'objets orientés et fortement regroupés

La détection d’objets orientés et fortement densément regroupés reste un défi en raison de l’aliasing des caractéristiques spatiales provoqué par l’intersection des champs de réception entre objets. Dans cet article, nous proposons une méthode d’adaptation des caractéristiques par enveloppe convexe (CFA, Convex-Hull Feature Adaptation), conçue pour ajuster les caractéristiques convolutionnelles en fonction des dispositions orientées et fortement denses des objets. La CFA s’appuie sur une représentation des caractéristiques par enveloppe convexe, définissant un ensemble de points de caractéristiques prédits de manière dynamique, guidés par une mesure d’intersection sur union convexe (CIoU), afin de délimiter précisément l’étendue des objets. La CFA cherche à atteindre une affectation optimale des caractéristiques en construisant des ensembles d’enveloppes convexes et en divisant dynamiquement les enveloppes convexes positives ou négatives. En tenant simultanément compte des superpositions entre enveloppes convexes et objets, tout en pénalisant les enveloppes convexes partagées par plusieurs objets, la CFA atténue efficacement l’aliasing des caractéristiques spatiales, conduisant à une adaptation optimale des caractéristiques. Les expériences menées sur les jeux de données DOTA et SKU110K-R montrent que la CFA surpasser significativement l’approche de référence, atteignant ainsi de nouveaux états de l’art en détection d’objets.