RandAugment : Une augmentation automatique des données pratique avec un espace de recherche réduit

Des travaux récents ont montré que la transformation des données (data augmentation) a le potentiel de améliorer de manière significative la généralisation des modèles d’apprentissage profond. Récemment, des stratégies d’augmentation automatisées ont permis d’atteindre des résultats de pointe en classification d’images et en détection d’objets. Bien que ces stratégies aient été optimisées pour améliorer la précision sur les données de validation, elles ont également permis d’obtenir des performances de pointe en apprentissage semi-supervisé et une meilleure robustesse face aux dégradations courantes des images. Un obstacle majeur à leur adoption à grande échelle réside dans la phase séparée de recherche, qui augmente la complexité de l’entraînement et peut entraîner une augmentation substantielle du coût computationnel. En outre, en raison de cette phase de recherche indépendante, ces approches ne peuvent pas ajuster dynamiquement la force de régularisation en fonction de la taille du modèle ou du jeu de données. Les politiques d’augmentation automatisées sont généralement découvertes en entraînant de petits modèles sur de petits jeux de données, puis appliquées à l’entraînement de modèles plus grands. Dans ce travail, nous éliminons ces deux obstacles. RandAugment réduit considérablement l’espace de recherche, permettant ainsi d’être entraîné directement sur la tâche cible sans nécessiter de tâche proxy séparée. De plus, grâce à sa paramétrisation, la force de régularisation peut être adaptée à différentes tailles de modèles et de jeux de données. RandAugment peut être utilisé de manière uniforme sur diverses tâches et jeux de données, et fonctionne immédiatement, égalant ou dépassant toutes les approches précédentes d’augmentation automatisée sur CIFAR-10/100, SVHN et ImageNet. Sur le jeu de données ImageNet, nous atteignons une précision de 85,0 %, soit une amélioration de 0,6 % par rapport à l’état de l’art précédent et de 1,0 % par rapport à l’augmentation de base. En détection d’objets, RandAugment permet une amélioration de 1,0 à 1,3 % par rapport à l’augmentation de base, et se situe à moins de 0,3 % de précision moyenne (mAP) d’AutoAugment sur COCO. Enfin, grâce à son hyperparamètre interprétable, RandAugment peut être utilisé pour étudier le rôle de l’augmentation des données en fonction de la taille du modèle et du jeu de données. Le code est disponible en ligne.