HyperAIHyperAI
il y a 11 jours

VDDT : Amélioration de la détection des navires grâce au transformateur déformable

{Lefan Wang, Zhihui Chen, Ruixin Zheng, Jinhe Su, Yiling Liu, Siyu Chen}
Résumé

La détection de navires a suscité un large intérêt dans le domaine de la détection d’objets, et le modèle récemment proposé DETR a réussi à réaliser une détection objet véritablement end-to-end, démontrant des performances prometteuses. Toutefois, DETR présente une faible sensibilité à la détection des objets de petite taille, ce qui limite sa performance dans le contexte de la détection de navires. Dans ce travail, nous adoptons Deformable DETR comme modèle de base et apportons des modifications à ce dernier. Premièrement, nous intégrons des informations relatives aux points de référence dans les requêtes d’objets afin d’enrichir les caractéristiques apprises par ces dernières, améliorant ainsi la performance du détecteur. Deuxièmement, nous remplaçons l’attention multi-têtes auto-attention par un perceptron multicouche afin de réduire l’effort computationnel du décodeur. Par ailleurs, nous avons collecté 85 vidéos annotées, contenant au total 4 563 images, et avons utilisé ces données pour construire un jeu de données dédié à la détection de navires. Les résultats expérimentaux obtenus sur notre jeu de données montrent que VDDT surpasse significativement le modèle de base.

VDDT : Amélioration de la détection des navires grâce au transformateur déformable | Articles de recherche récents | HyperAI