ChimeraMix : Classification d'images sur de petits ensembles de données par mélange de caractéristiques masquées

Les réseaux de neurones convolutifs profonds nécessitent de grandes quantités d'échantillons de données étiquetés. Pour de nombreuses applications dans le monde réel, c'est une limitation majeure qui est généralement traitée par des méthodes d'augmentation de données. Dans ce travail, nous abordons le problème de l'apprentissage de réseaux de neurones profonds sur des petits ensembles de données. Notre architecture proposée, appelée ChimeraMix, apprend une augmentation de données en générant des compositions d'instances. Le modèle génératif encode les images par paires, combine les caractéristiques guidées par un masque et crée de nouveaux échantillons. Pour l'évaluation, toutes les méthodes sont formées à partir de zéro sans aucune donnée supplémentaire. Plusieurs expériences menées sur des ensembles de données de référence, tels que ciFAIR-10, STL-10 et ciFAIR-100, démontrent la supériorité des performances de ChimeraMix par rapport aux méthodes actuelles les plus avancées pour la classification sur des petits ensembles de données.