L'ajuster ou ne pas l'utiliser : Évaluation de la classification d'images efficace en termes de données

L'optimisation de la classification d'images avec des réseaux neuronaux profonds dans des contextes où seules de petites quantités de données étiquetées sont disponibles a été un domaine de recherche actif ces dernières années. Cependant, une comparaison objective entre les méthodes publiées est difficile, car les travaux existants utilisent différents ensembles de données pour l'évaluation et comparent souvent à des modèles de base non ajustés avec des hyperparamètres par défaut. Nous avons conçu un banc d'essai pour la classification d'images optimisée en termes de données, composé de six ensembles de données variés couvrant divers domaines (par exemple, images naturelles, imagerie médicale, données satellites) et types de données (RGB, niveaux de gris, multispécifiques). En utilisant ce banc d'essai, nous avons réévalué le modèle de base standard basé sur l'entropie croisée ainsi que huit méthodes pour l'apprentissage profond optimisé en termes de données publiées entre 2017 et 2021 dans des revues renommées. Pour une comparaison équitable et réaliste, nous avons soigneusement ajusté les hyperparamètres de toutes les méthodes sur chaque ensemble de données. De manière surprenante, nous avons constaté qu'en ajustant le taux d'apprentissage, la décroissance du poids et la taille du lot sur une partition distincte de validation, on obtient un modèle de base hautement compétitif qui surpassait toutes les méthodes spécialisées sauf une et se montrait compétitif par rapport à cette dernière.