SPAct: Selbstüberwachende Datenschutzprävention für die Aktionserkennung

Visuelle Privatsphäre-Verletzungen stellen ein zunehmend wichtiges Problem für die rasant wachsenden Anwendungen im Bereich der Videoverstehens wie Aktivitätserkennung dar. Bestehende Ansätze zur Minderung von Privatsphäre-Lecks bei der Aktivitätserkennung erfordern neben den Aktivitätslabels auch Privatsphäre-Labels aus dem Videodatensatz. Die Annotation von Videoframes hinsichtlich Privatsphäre-Labels ist jedoch nicht praktikabel. Neuere Entwicklungen im Bereich des selbstüberwachten Lernens (self-supervised learning, SSL) haben das bisher ungenutzte Potenzial von unbeschrifteten Daten erschlossen. Erstmals präsentieren wir einen neuartigen Trainingsrahmen, der privatsphärebezogene Informationen auf selbstüberwachtem Wege aus Eingabevideos entfernt, ohne dass Privatsphäre-Labels erforderlich sind. Unser Trainingsrahmen besteht aus drei Hauptkomponenten: einer Anonymisierungsfunktion, einem selbstüberwachten Privatsphäre-Entfernungs-Branch und einem Aktivitätserkennungs-Branch. Wir trainieren unseren Rahmen mittels einer Minimax-Optimierungsstrategie, um die Aktivitätserkennungskostenfunktion zu minimieren und gleichzeitig die Privatsphäre-Kostenfunktion über eine kontrastive selbstüberwachte Verlustfunktion zu maximieren. Unter Verwendung etablierter Protokolle für bekannte Aktivitäten und Privatsphärenmerkmale erreicht unser Rahmen ein konkurrenzfähiges Verhältnis zwischen Aktivitätserkennung und Privatschutz im Vergleich zu aktuellen state-of-the-art überwachten Methoden. Zudem führen wir ein neues Protokoll zur Evaluierung der Generalisierbarkeit der gelernten Anonymisierungsfunktion auf neue Aktivitäten und Privatsphärenmerkmale ein und zeigen, dass unser selbstüberwachter Rahmen bestehende überwachte Methoden übertrifft. Der Quellcode ist verfügbar unter: https://github.com/DAVEISHAN/SPAct