Apprentissage de stratégies d'augmentation de données pour la détection d'objets

L'augmentation de données est un élément crucial dans l'entraînement des modèles d'apprentissage profond. Bien que l'augmentation de données ait été démontrée comme améliorant considérablement la classification d'images, son potentiel n'a pas été pleinement exploré pour la détection d'objets. Étant donné le coût supplémentaire de l'annotation des images pour la détection d'objets, l'augmentation de données peut être encore plus importante pour cette tâche en vision par ordinateur. Dans ce travail, nous étudions l'impact de l'augmentation de données sur la détection d'objets. Nous montrons d'abord que les opérations d'augmentation de données empruntées à la classification d'images peuvent être utiles pour entraîner des modèles de détection, mais que l'amélioration est limitée. Par conséquent, nous examinons comment les politiques d'augmentation de données apprises et spécialisées améliorent les performances de généralisation des modèles de détection. Il est important de noter que ces politiques d'augmentation ne touchent que l'entraînement et n'affectent pas le modèle entraîné lors de l'évaluation. Les expériences menées sur le jeu de données COCO montrent qu'une politique d'augmentation de données optimisée améliore la précision de détection de plus de +2,3 mAP (mean Average Precision), permettant à un seul modèle d'inférence d'atteindre une précision record de 50,7 mAP. De manière significative, la meilleure politique trouvée sur COCO peut être transférée sans modification vers d'autres jeux de données et modèles pour améliorer la précision prédictive. Par exemple, la meilleure politique d'augmentation identifiée avec COCO améliore une ligne de base solide sur PASCAL-VOC (VOC) par +2,7 mAP. Nos résultats révèlent également qu'une politique d'augmentation apprise est supérieure aux méthodes actuelles les plus avancées de régularisation architecturale pour la détection d'objets, même en tenant compte des lignes de base solides. Le code pour entraîner avec la politique apprise est disponible en ligne à l’adresse suivante : https://github.com/tensorflow/tpu/tree/master/models/official/detection