SSD: Ein einheitlicher Rahmen für selbstüberwachtes Ausreißerdetektionsverfahren

Wir stellen die folgende Frage: Welche Trainingsinformation ist erforderlich, um einen effektiven Ausreißer-/Out-of-Distribution (OOD)-Detektor zu entwerfen, also ein Modell, das Muster erkennt, die weit entfernt von der Trainingsverteilung liegen? Da für viele Anwendungen unlabeled Daten leicht zugänglich sind, erscheint der vielversprechendste Ansatz, Detektoren allein auf Basis von unlabeled In-Distribution-Daten zu entwickeln. Allerdings stellen wir fest, dass die meisten bestehenden Detektoren, die ausschließlich auf unlabeled Daten basieren, schlecht abschneiden und oft einer zufälligen Vorhersage entsprechen. Im Gegensatz dazu erreichen bestehende state-of-the-art OOD-Detektoren beeindruckende Leistungen, erfordern jedoch Zugriff auf fein granulierte Datenlabels für überwachtes Training. Wir schlagen SSD vor, einen Ausreißer-Detektor, der ausschließlich auf unlabeled In-Distribution-Daten basiert. Unser Ansatz kombiniert selbstüberwachte Darstellungslernverfahren mit einer Detektion auf Basis der Mahalanobis-Distanz im Merkmalsraum. Wir zeigen, dass SSD die meisten bestehenden Detektoren, die auf unlabeled Daten basieren, deutlich übertrifft. Darüber hinaus erreicht SSD Leistungen, die mit denen überwachter Detektoren vergleichbar sind, und in einigen Fällen sogar besser sind. Schließlich erweitern wir unseren Detektionsansatz um zwei zentrale Erweiterungen. Erstens formulieren wir den Few-Shot-OOD-Detektionsansatz, bei dem der Detektor Zugriff auf lediglich ein bis fünf Proben pro Klasse des Ziel-OOD-Datensatzes hat. Zweitens erweitern wir unseren Rahmen, um Trainingslabels zu integrieren, falls verfügbar. Wir beobachten, dass unser neuartiger Detektionsansatz auf Basis von SSD durch diese Erweiterungen eine verbesserte Leistung erzielt und letztlich state-of-the-art-Leistung erreicht. Unser Code ist öffentlich unter https://github.com/inspire-group/SSD verfügbar.