Détection de nouveauté semi-supervisée basée sur des ensembles avec désaccord régularisé

Les réseaux de neurones profonds prédisent souvent des échantillons avec une forte confiance, même lorsqu’ils proviennent de classes inconnues, ce qui devrait au contraire déclencher une évaluation par un expert. Les algorithmes actuels de détection de nouveauté ne parviennent pas à identifier de manière fiable ces points proches de la distribution hors-domaine (OOD) sans accès à des données étiquetées similaires à ces nouveaux échantillons. Dans cet article, nous proposons une nouvelle procédure fondée sur l’ensemblage pour la détection de nouveauté semi-supervisée (SSND), qui exploite efficacement un mélange d’échantillons non étiquetés appartenant à la distribution intra-domaine (ID) et à des classes nouvelles afin d’obtenir de bonnes performances de détection. Plus précisément, nous montrons comment induire un désaccord uniquement sur les données OOD en utilisant une régularisation par arrêt anticipé. Bien que nous prouvions ce résultat pour une distribution de données simple, nos expérimentations étendues suggèrent qu’il reste valable dans des scénarios plus complexes : notre approche surpasse significativement les méthodes d’état de l’art en SSND sur des jeux de données d’images standard (SVHN/CIFAR-10/CIFAR-100) ainsi que sur des jeux de données d’images médicales, avec une augmentation négligeable du coût computationnel.