Rekonstruktion durch Inpainting für visuelle Anomalieerkennung
Die visuelle Anomalieerkennung befasst sich mit der Klassifikation oder Lokalisierung von Regionen in einem Bild, die von ihrem normalen Erscheinungsbild abweichen. Ein gängiger Ansatz trainiert einen Autoencoder an anormaliefreien Bildern und führt die Anomalieerkennung durch Berechnung der Differenz zwischen Eingabebild und rekonstruiertem Bild durch. Dieser Ansatz geht davon aus, dass der Autoencoder anomale Regionen nicht präzise rekonstruieren kann. In der Praxis generalisieren neuronale Netze jedoch gut auch auf Anomalien und rekonstruieren diese ausreichend gut, wodurch die Erkennungsfähigkeit reduziert wird. Eine präzise Rekonstruktion ist dagegen weitaus unwahrscheinlicher, wenn die anormalen Pixel dem Autoencoder nicht zugänglich waren. Daher formulieren wir die Anomalieerkennung als selbstüberwachtes Rekonstruktionsproblem mittels Inpainting. Unser Ansatz (RIAD) entfernt zufällig Teile von Bildregionen und rekonstruiert das Bild aus partiellen Inpaintings, wodurch die Nachteile herkömmlicher Autoencoder-Verfahren überwunden werden. RIAD wird umfassend an mehreren Benchmarks evaluiert und erreicht eine neue State-of-the-Art-Leistung auf einem kürzlich veröffentlichten, äußerst anspruchsvollen Benchmark für Anomalieerkennung.