PyramidFlow: Hochauflösende Defektkontrastive Lokalisierung mittels Pyramiden-Normalisierender Flüsse

Während der industriellen Verarbeitung können aufgrund uncontrollierbarer Faktoren unvorhergesehene Defekte in Produkten auftreten. Obwohl unüberwachte Methoden bei der Defektlokalisierung bereits erfolgreich waren, führt die übliche Verwendung vortrainierter Modelle zu geringauflösenden Ausgaben, was die visuelle Leistung beeinträchtigt. Um dieses Problem zu lösen, stellen wir PyramidFlow vor – die erste vollständig normalisierende Flussmethode, die auf vortrainierte Modelle verzichtet und dennoch eine hochauflösende Defektlokalisierung ermöglicht. Konkret schlagen wir eine latenten Template-basierte, defekt-contrastive Lokalisierungsparadigma vor, das die intra-klassen Varianz verringert, ähnlich wie vortrainierte Modelle es tun. Darüber hinaus nutzt PyramidFlow pyramidenartige normalisierende Flüsse zur Multi-Skalen-Fusion und Volumen-Normalisierung, um die Generalisierbarkeit zu verbessern. Unsere umfassenden Studien auf MVTecAD zeigen, dass die vorgeschlagene Methode vergleichbare Algorithmen, die externe Priorwissen nicht verwenden, übertrifft und selbst in anspruchsvolleren BTAD-Szenarien eine state-of-the-art-Leistung erzielt.