AutoAugment : Apprentissage de stratégies d'augmentation à partir des données

L’augmentation de données est une technique efficace pour améliorer la précision des classificateurs d’images modernes. Toutefois, les implémentations actuelles d’augmentation de données sont conçues manuellement. Dans cet article, nous présentons une procédure simple appelée AutoAugment, permettant de rechercher automatiquement des politiques d’augmentation améliorées. Dans notre implémentation, nous avons défini un espace de recherche dans lequel une politique se compose de plusieurs sous-politiques, dont une est sélectionnée aléatoirement pour chaque image au sein d’un mini-batch. Chaque sous-politique est composée de deux opérations, chaque opération étant une fonction de traitement d’image telle que la translation, la rotation ou la cisaillement, ainsi que les probabilités et les intensités avec lesquelles ces fonctions sont appliquées. Nous utilisons un algorithme de recherche pour identifier la meilleure politique permettant au réseau neuronal d’atteindre la précision de validation la plus élevée sur un jeu de données cible. Notre méthode atteint des performances de pointe sur CIFAR-10, CIFAR-100, SVHN et ImageNet (sans données supplémentaires). Sur ImageNet, nous obtenons une précision Top-1 de 83,5 %, soit une amélioration de 0,4 % par rapport au précédent record de 83,1 %. Sur CIFAR-10, nous atteignons un taux d’erreur de 1,5 %, soit une amélioration de 0,6 % par rapport à l’état de l’art précédent. Les politiques d’augmentation que nous identifions sont transférables entre différents jeux de données : la politique apprise sur ImageNet se transpose efficacement pour produire des améliorations significatives sur d’autres jeux de données, tels que Oxford Flowers, Caltech-101, Oxford-IIT Pets, FGVC Aircraft et Stanford Cars.