Affectation dynamique de labels sensible aux catégories avec propositions orientées de haute qualité

Les objets présents dans les images aériennes sont généralement intégrés dans des arrière-plans complexes et présentent des orientations arbitraires. Lorsqu’on utilise des boîtes englobantes orientées (OBB) pour représenter des objets orientés arbitrairement, la périodicité des angles peut entraîner des discontinuités dans les valeurs de régression des étiquettes aux frontières, provoquant des fluctuations brutales dans la fonction de perte. Pour résoudre ce problème, une représentation OBB basée sur le plan complexe est introduite dans le cadre de la détection orientée, accompagnée de la proposition d’une fonction de perte trigonométrique. Par ailleurs, en exploitant les connaissances a priori sur les environnements arrière-plans complexes et les différences marquées entre objets de grande taille dans les images aériennes, un head RPN de type conformer est conçu pour prédire les informations d’orientation. La fonction de perte proposée et le head RPN conformer génèrent conjointement des propositions orientées de haute qualité. Une affectation dynamique des étiquettes sensible aux catégories, fondée sur un retour de prédiction de catégorie, est proposée afin de surmonter les limites liées à une affectation d’étiquettes des propositions basée uniquement sur le IoU. Cette méthode rend le choix des échantillons négatifs plus représentatif, assurant une cohérence entre les caractéristiques de classification et celles de régression. Des expériences ont été menées sur quatre jeux de données réalistes de détection orientée, et les résultats montrent une performance supérieure dans la détection d’objets orientés, avec un ajustement minimal des paramètres et un coût temporel réduit. Plus précisément, des scores de précision moyenne par classe (mAP) de 82,02 %, 71,99 %, 69,87 % et 98,77 % ont été atteints respectivement sur les jeux de données DOTA-v1.0, DOTA-v1.5, DIOR-R et HRSC2016.