UniformAugment : Une approche probabiliste d’augmentation de données sans recherche

L’augmentation des jeux de données d’entraînement s’est avérée améliorer l’efficacité d’apprentissage pour plusieurs tâches de vision par ordinateur. Une bonne augmentation produit un jeu de données augmenté qui introduit une variabilité tout en préservant les propriétés statistiques du jeu de données d’origine. Certaines méthodes, telles qu’AutoAugment et Fast AutoAugment, ont introduit une phase de recherche afin de déterminer un ensemble de politiques d’augmentation adaptées à un modèle et à un jeu de données donnés. Ce processus s’accompagne d’un coût computationnel élevé, pouvant atteindre plusieurs milliers d’heures de calcul sur GPU. Plus récemment, RandAugment a été proposé pour accélérer significativement cette phase de recherche en approximant l’espace de recherche par un petit nombre d’hyperparamètres, mais il reste sujet à un coût non négligeable lié à l’ajustement de ces derniers. Dans ce papier, nous montrons que, sous l’hypothèse que l’espace d’augmentation est approximativement invariant par rapport à la distribution, un échantillonnage uniforme dans l’espace continu des transformations d’augmentation est suffisant pour entraîner des modèles hautement efficaces. À partir de ce résultat, nous proposons UniformAugment, une approche automatisée d’augmentation des données qui élimine complètement la phase de recherche. En plus d’exposer les fondements théoriques soutenant notre méthode, nous démontrons, à l’aide de jeux de données standards et de modèles établis pour la classification d’images, que l’efficacité de UniformAugment est comparable à celle des méthodes précédemment citées, tout en restant extrêmement efficace grâce à l’absence de toute phase de recherche.