Graphkonvolutioneller Label-Noise-Cleaner: Trainieren eines einsteckbaren Aktionklassifizierers für Anomalieerkennung

Die Videoanomaliedetektion bei schwachen Labels wird in früheren Arbeiten als ein typisches Problem des Multiple-Instance-Learnings formuliert. In diesem Papier bieten wir eine neue Perspektive, nämlich eine überwachte Lernaufgabe unter rauschigen Labels. Aus dieser Sicht kann man, sobald das Label-Rauschen entfernt ist, vollständig überwachte Aktionsklassifizierer direkt für die schwach überwachte Anomaliedetektion anwenden und den Vorteil dieser gut entwickelten Klassifizierer optimal nutzen. Zu diesem Zweck haben wir ein Graphik-Faltungsnetzwerk (Graph Convolutional Network) entwickelt, um rauschige Labels zu korrigieren. Auf der Grundlage von Merkmalsähnlichkeit und zeitlicher Konsistenz verbreitet unser Netzwerk Überwachungssignale von Snippets mit hoher Zuverlässigkeit auf solche mit niedriger Zuverlässigkeit. Auf diese Weise ist das Netzwerk in der Lage, gereinigte Überwachung für Aktionsklassifizierer bereitzustellen. Während der Testphase müssen wir lediglich die Snippet-basierten Vorhersagen vom Aktionsklassifizierer ohne zusätzliche Nachbearbeitung erhalten. Umfangreiche Experimente auf 3 Datensätzen unterschiedlicher Größen mit 2 Arten von Aktionsklassifizierern zeigen die Effektivität unserer Methode. Bemerkenswerterweise erreichen wir einen framebasierten AUC-Wert von 82,12 % auf dem UCF-Crime-Datensatz.