Das Fangen von Grauen und Schwarzen Schwänen: Offen-Set überwachte Anomalieerkennung

Obwohl die meisten bestehenden Arbeiten zum Anomalieerkennung davon ausgehen, dass lediglich normale Trainingsbeispiele zur Verfügung stehen, sind in vielen realen Anwendungen häufig doch einige gelabelte Anomaliebeispiele vorhanden, beispielsweise Defekthäufigkeiten, die bei zufälligen Qualitätsprüfungen erfasst werden, oder durch Radiologen in der täglichen medizinischen Bildscreening bestätigte Läsionenbilder. Diese Anomaliebeispiele vermitteln wertvolle, anwendungsspezifische Kenntnisse über abnorme Muster und ermöglichen in einigen jüngeren Modellen eine signifikant verbesserte Erkennung ähnlicher Anomalien. Allerdings repräsentieren die während des Trainings gesehenen Anomalien oft nicht alle möglichen Anomalieklassen, wodurch diese Modelle in ihrer Fähigkeit zur Generalisierung auf bisher unbekannte Anomalieklassen eingeschränkt sind. In dieser Arbeit behandeln wir die offene, überwachte Anomalieerkennung, bei der wir Erkennungsmodelle anhand von Anomaliebeispielen trainieren, mit dem Ziel, sowohl bekannte Anomalien („Graue Schwäne“) als auch unbekannte Anomalien („Schwarze Schwäne“) zu detektieren. Wir stellen einen neuartigen Ansatz vor, der entkoppelte Darstellungen von Anomalien lernt, die durch gesehene Anomalien, Pseudanomalien und latente Restanomalien (d. h. Datenpunkte, die im latenten Raum ungewöhnliche Residuen im Vergleich zu normalen Daten aufweisen) repräsentiert werden. Letztere beiden Klassen sind speziell darauf ausgelegt, unbekannte Anomalien zu erkennen. Umfangreiche Experimente auf neun realen Anomalieerkennungs-Datensätzen zeigen die überlegene Leistung unseres Modells bei der Erkennung sowohl bekannter als auch unbekannter Anomalien unter verschiedenen Bedingungen. Der Quellcode und die Daten sind verfügbar unter: https://github.com/choubo/DRA.