Amélioration de la détection d'objets dans les images artistiques à l'aide uniquement du transfert de style

Malgré les progrès récents dans la détection d’objets à l’aide de réseaux de neurones profonds, ces derniers peinent encore à identifier des objets dans des images d’art, telles que des peintures ou des dessins. Ce défi est connu sous le nom de « problème de représentation croisée » et provient en partie de la tendance des réseaux de neurones à privilégier la texture d’un objet plutôt que sa forme. Dans cet article, nous proposons et évaluons un processus d’entraînement des réseaux de neurones afin de localiser des objets – plus précisément des personnes – dans des images d’art. Nous générons un grand jeu de données pour l’entraînement et la validation en modifiant les images du jeu de données COCO à l’aide d’une méthode de transfert de style AdaIn. Ce jeu de données est utilisé pour affiner un réseau de détection d’objets Faster R-CNN, qui est ensuite testé sur le jeu de données existant People-Art. Les résultats montrent une amélioration significative par rapport à l’état de l’art, ouvrant ainsi une nouvelle voie pour la création de jeux de données destinés à entraîner des réseaux de neurones à traiter des images d’art.