PP-YOLOE-R : un détecteur d'objets tournés sans ancres efficace

La détection d'objets orientés arbitrairement est une tâche fondamentale dans l'analyse de scènes visuelles, notamment dans les images aériennes et le texte scénique. Dans ce rapport, nous présentons PP-YOLOE-R, un détecteur d'objets rotatifs efficace et sans ancres basé sur PP-YOLOE. Nous introduisons dans PP-YOLOE-R une série de techniques utiles visant à améliorer la précision de détection tout en ajoutant un coût supplémentaire négligeable en termes de paramètres et de charge computationnelle. En conséquence, PP-YOLOE-R-l et PP-YOLOE-R-x atteignent respectivement des scores de 78,14 et 78,28 mAP sur le jeu de données DOTA 1.0 avec une entraînement et un test à échelle unique, surpassant ainsi presque tous les autres détecteurs rotatifs existants. Lorsqu’un entraînement et un test à plusieurs échelles sont utilisés, les performances s’améliorent davantage, atteignant 80,02 et 80,73 mAP pour PP-YOLOE-R-l et PP-YOLOE-R-x. Dans ce cas, PP-YOLOE-R-x dépasse tous les méthodes sans ancres et affiche une performance compétitive par rapport aux modèles de pointe à deux étapes basés sur des ancres. En outre, PP-YOLOE-R est conçu pour être facilement déployable : les versions PP-YOLOE-R-s/m/l/x atteignent respectivement 69,8 / 55,1 / 48,3 / 37,1 FPS sur une RTX 2080 Ti avec TensorRT et une précision FP16. Le code source ainsi que les modèles pré-entraînés sont disponibles à l’adresse suivante : https://github.com/PaddlePaddle/PaddleDetection, développé par https://github.com/PaddlePaddle/Paddle.