Same Same But DifferNet: Semi-supervised Defect Detection mit Normalisierenden Flows

Die Erkennung von Fertigungsfehlern ist entscheidend für die Qualitätssicherung und Einhaltung von Sicherheitsstandards in Fertigungsprozessen. Da viele Defekte äußerst selten auftreten und ihre Merkmale a priori meist unbekannt sind, bleibt ihre Detektion weiterhin eine offene Forschungsfrage. Um diesem Problem zu begegnen, stellen wir DifferNet vor: Es nutzt die beschreibende Kraft von Features, die durch konvolutionale neuronale Netze extrahiert werden, um deren Dichte mittels Normalisierungsflüssen zu schätzen. Normalisierungsflüsse eignen sich besonders gut zur Modellierung niedrigdimensionaler Datenverteilungen. Sie erweisen sich jedoch als weniger geeignet für hochdimensionale Bilddaten. Daher setzen wir einen mehrskaligen Feature-Extractor ein, der es dem Normalisierungsfluss ermöglicht, den Bildern sinnvolle Wahrscheinlichkeiten zuzuordnen. Auf Basis dieser Wahrscheinlichkeiten entwickeln wir eine Score-Funktion, die auf Defekte hinweist. Darüber hinaus ermöglicht die Rückpropagation des Scores auf das Bild eine pixelgenaue Lokalisierung der Fehler. Um eine hohe Robustheit und Leistung zu erreichen, nutzen wir während Training und Evaluierung mehrere Transformationen. Im Gegensatz zu den meisten anderen Ansätzen benötigt unser Verfahren keine großen Mengen an Trainingsdaten und zeigt bereits mit lediglich 16 Bildern gute Ergebnisse. Wir demonstrieren die überlegene Leistung gegenüber bestehenden Ansätzen anhand der anspruchsvollen und neu vorgeschlagenen Datensätze MVTec AD und Magnetic Tile Defects.