Population Based Augmentation : Apprentissage Efficace des Programmes de Politiques d'Augmentation

Un défi majeur dans l'exploitation de l'augmentation de données pour l'entraînement des réseaux neuronaux est de choisir une politique d'augmentation efficace parmi un vaste espace de recherche d'opérations candidates. Une politique d'augmentation bien choisie peut entraîner des améliorations significatives de la généralisation ; cependant, les approches de pointe telles qu'AutoAugment sont trop coûteuses en termes de calcul pour être utilisées par un utilisateur ordinaire. Dans cet article, nous présentons un nouvel algorithme d'augmentation de données, Population Based Augmentation (PBA), qui génère des calendriers de politiques d'augmentation non stationnaires plutôt qu'une politique d'augmentation fixe. Nous montrons que PBA peut égaler les performances d'AutoAugment sur CIFAR-10, CIFAR-100 et SVHN, avec trois ordres de grandeur moins de calcul global. Sur CIFAR-10, nous obtenons une erreur moyenne de test de 1,46 %, ce qui représente une légère amélioration par rapport à l'état actuel de l'art. Le code source de PBA est librement disponible et peut être consulté à l'adresse https://github.com/arcelien/pba.