Une Variante Rééchantillonnée de ImageNet en Alternative aux Jeux de Données CIFAR

Le jeu de données ImageNet original est une référence à grande échelle largement utilisée pour l'entraînement des Réseaux Neuronaux Profonds. Étant donné que le coût des expérimentations (par exemple, la conception d'algorithmes, la recherche d'architecture et l'ajustement des hyperparamètres) sur ce jeu de données peut être prohibitif, nous proposons d'envisager une version rééchantillonnée de ImageNet. Contrairement aux jeux de données CIFAR et aux versions antérieures rééchantillonnées de ImageNet, notre proposition ImageNet32×32 (ainsi que ses variantes ImageNet64×64 et ImageNet16×16) contient exactement le même nombre de classes et d'images que ImageNet, avec la seule différence que les images sont rééchantillonnées à 32×32 pixels par image (64×64 et 16×16 pixels pour les variantes respectivement). Les expérimentations sur ces versions rééchantillonnées sont considérablement plus rapides que sur l'ImageNet original, et les caractéristiques des jeux de données rééchantillonnés en termes d'hyperparamètres optimaux semblent rester similaires. Les jeux de données proposés ainsi que les scripts permettant de reproduire nos résultats sont disponibles à l'adresse http://image-net.org/download-images et https://github.com/PatrykChrabaszcz/Imagenet32_Scripts.