CSI: Novelty Detection durch kontrastives Lernen auf verteilungsverschobenen Instanzen

Die Erkennung von Neuem (Novelty Detection), also die Identifizierung, ob eine gegebene Probe aus einer außerhalb der Trainingsverteilung liegenden Quelle stammt, ist entscheidend für zuverlässiges maschinelles Lernen. Hierfür wurden zahlreiche Ansätze unternommen, um eine für die Erkennung von Neuem gut geeignete Repräsentation zu lernen und auf Basis dieser Repräsentation eine Detektions-Score-Funktion zu entwerfen. In diesem Paper stellen wir eine einfache, jedoch effektive Methode namens „Contrasting Shifted Instances“ (CSI) vor, die sich an dem jüngsten Erfolg der kontrastiven Lernansätze für visuelle Repräsentationen orientiert. Insbesondere kontrastieren wir neben der herkömmlichen Vorgehensweise, bei der eine Probe mit anderen Instanzen verglichen wird, die Probe auch mit verteilungsverschobenen Augmentierungen derselben Probe. Auf dieser Grundlage schlagen wir einen neuen Detektions-Score vor, der spezifisch für das vorgeschlagene Trainingsverfahren ist. Unsere Experimente belegen die Überlegenheit unserer Methode in verschiedenen Szenarien der Erkennung von Neuem, einschließlich unlabeled one-class, unlabeled multi-class und labeled multi-class Einstellungen, anhand verschiedener Bild-Benchmark-Datensätze. Der Quellcode und vortrainierte Modelle sind unter https://github.com/alinlab/CSI verfügbar.