HyperAIHyperAI

Command Palette

Search for a command to run...

Zweistufiges, grob-zu-fein ausgerichtetes Modell für die Bildanomalie-Segmentierung und -Erkennung

HyungWon Kim Odilbek Urmonov Rizwan Ali Shah

Zusammenfassung

Bekannte auf Convolutional Neural Networks (CNN) basierende Ansätze zur Anomalieerkennung und -segmentierung sind entweder übermäßig empfindlich gegenüber Rauschen oder nicht empfindlich genug, was zu einer unvollständigen Erkennung von Anomalie-Mustern im Teststadium führt. Obwohl frühere Methoden in der Lage sind, normale und abnormale Bilder zu unterscheiden, können sie die genaue Lage von Anomalien in Testbildern nicht mit hoher Genauigkeit identifizieren. Um dieses Problem zu lösen, stellen wir ein zweistufiges CNN-Modell für eine grob-zu-fein Anomalie-Segmentierung und -Erkennung namens TASAD (Two-stage Anomaly Segmentation and Detection) vor. In beiden Stufen trainieren wir unser Modell auf einer Mischung aus normalen und abnormalen Trainingsbeispielen. Die abnormen Bilder werden durch Einbetten von Pseudo-Anomalie-Mustern erzeugt, die automatisch aus Anomalie-Quellbildern generiert werden. Wir verwenden eine neuartige und anspruchsvolle Technik zur Anomalie-Einbettung, um eine Vielzahl unterschiedlicher anormaler Proben zu erzeugen. In der ersten Stufe entwerfen wir ein Modell zur groben Anomalie-Segmentierung (Coarse Anomaly Segmentation, CAS), das ein vollständiges Bild als Eingabe verwendet. In der zweiten Stufe trainieren wir ein fein granulares Anomalie-Segmentierungsmodell (Fine Anomaly Segmentation, FAS) auf Bildpatches. Das FAS-Modell verbessert die Erkennungs- und Segmentierungsgenauigkeit, indem es die Anomalie-Muster, die teilweise von dem CAS-Modell erfasst wurden, verfeinert. Wir evaluieren unser Framework am MVTec-Datensatz und vergleichen es mit aktuellen State-of-the-Art (SOTA)-Methoden. Die vorgeschlagene Architektur führt zu einer kompakten Modellgröße – viermal kleiner als die SOTA-Methode – gleichzeitig jedoch zu einer besseren Pixelgenauigkeit. TASAD kann zudem auf bestehende SOTA-Methoden angewendet werden, um deren Anomalieerkennungsleistung weiter zu verbessern. Unsere Experimente zeigen, dass die Anwendung von TASAD auf die neuesten SOTA-Methoden die durchschnittliche Präzision (Average Precision, AP) der vorherigen Ansätze um 6,2 % steigert. Für die Reproduzierbarkeit der Ergebnisse stellen wir den Quellcode unter https://github.com/RizwanAliQau/tasad.git bereit.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Zweistufiges, grob-zu-fein ausgerichtetes Modell für die Bildanomalie-Segmentierung und -Erkennung | Paper | HyperAI