Semi-supervised Novelty Detection mittels Ensembles mit regularisiertem Unstimmigkeitsverhalten

Tiefen neuronale Netze geben oft Proben mit hoher Konfidenz vorher, selbst wenn diese aus bisher unbekannten Klassen stammen und stattdessen zur Expertenevaluation markiert werden sollten. Derzeitige Algorithmen zur Neuheitserkennung können solche nahezu außerhalb der Trainingsverteilung (near OOD) liegenden Punkte nicht zuverlässig identifizieren, es sei denn, sie verfügen über gelabelte Daten, die den neuen Proben ähnlich sind. In diesem Paper entwickeln wir ein neues, auf Ensembles basierendes Verfahren für semi-supervised Neuheitserkennung (SSND), das eine Mischung aus unlabeled In-Distribution (ID)- und neuartigen Klassenproben effektiv nutzt, um eine gute Erkennungsleistung zu erzielen. Insbesondere zeigen wir, wie durch Early-Stopping-Regularisierung nur auf OOD-Daten eine Diskrepanz erzeugt werden kann. Obwohl wir diese Eigenschaft für eine einfache Datenausgangsverteilung beweisen, deuten unsere umfangreichen Experimente darauf hin, dass sie auch für komplexere Szenarien gilt: Unser Ansatz übertrifft state-of-the-art-SSND-Methoden erheblich auf Standard-Bild-Datensätzen (SVHN/CIFAR-10/CIFAR-100) sowie auf medizinischen Bilddatensätzen – und das mit nur vernachlässigbarer Zunahme der Rechenkosten.