PhysAug : Une augmentation de données guidée par la physique et basée sur la fréquence pour la détection d'objets généralisée à domaine unique

La détection d'objets généralisée à domaine unique (S-DGOD) vise à entraîner un détecteur sur une seule source de données afin d’obtenir une performance robuste sur une variété de domaines cibles inconnus. Les approches existantes de S-DGOD s’appuient fréquemment sur des stratégies d’augmentation de données, comprenant une combinaison de transformations visuelles, afin d’améliorer la capacité de généralisation du détecteur. Toutefois, l’absence de connaissances a priori du monde réel limite l’apport de l’augmentation de données à la diversité des distributions de données d’entraînement. Pour remédier à ce problème, nous proposons PhysAug, une nouvelle méthode d’augmentation de données basée sur un modèle physique, conçue pour des conditions d’acquisition d’images non idéales, afin d’améliorer l’adaptabilité des tâches S-DGOD. Inspirés des principes de l’optique atmosphérique, nous avons développé un modèle de perturbation universel, qui constitue la base de notre méthode PhysAug. Étant donné que les perturbations visuelles proviennent typiquement de l’interaction de la lumière avec les particules atmosphériques, nous exploitons le spectre de fréquence des images pour simuler des variations réalistes lors de l’entraînement. Cette approche permet au détecteur d’apprendre des représentations invariantes par rapport au domaine, renforçant ainsi sa capacité à généraliser dans diverses configurations. Sans modifier l’architecture du réseau ni la fonction de perte, notre méthode surpasse significativement l’état de l’art sur plusieurs jeux de données S-DGOD. En particulier, elle atteint une amélioration notable de 7,3 % et 7,2 % par rapport à la base sur les jeux de données DWD et Cityscapes-C, mettant en évidence une meilleure généralisation dans des environnements réels.