Projection de points sur des axes : détection d'objets orientés via une représentation point-axe

Cet article présente une nouvelle représentation point-axe pour la détection d'objets orientés, mettant l'accent sur sa flexibilité et son caractère géométriquement intuitif, fondée sur deux composants clés : les points et les axes. 1) Les points définissent l'étendue spatiale et les contours des objets, offrant des descriptions détaillées de leur forme. 2) Les axes caractérisent les directions principales des objets, fournissant des indices essentiels d'orientation cruciaux pour une détection précise. La représentation point-axe découple la localisation et la rotation, résolvant ainsi les problèmes de discontinuité liés à la rotation fréquemment rencontrés dans les approches classiques basées sur les boîtes englobantes. Pour une optimisation efficace sans introduire d'étiquetages supplémentaires, nous proposons une perte de projection maximale afin de superviser l'apprentissage des ensembles de points, ainsi qu'une perte croisée d'axe pour une représentation robuste des axes. En outre, en exploitant cette représentation, nous introduisons le modèle Oriented DETR, intégrant de manière fluide le cadre DETR pour prédire précisément les points et axes, ainsi que pour réaliser une détection end-to-end. Les résultats expérimentaux démontrent des améliorations significatives des performances dans les tâches de détection d'objets orientés.