Eine explorative Studie zur menschenzentrierten Videoanomalieerkennung durch variationale Autoencoder und Trajektorienvorhersage

Die Videoanomalieerkennung (VAD) stellt eine herausfordernde und bedeutende Forschungsaufgabe im Bereich der Computer Vision dar. In den letzten Jahren hat die posebasierte Videoanomalieerkennung (PAD) aufgrund mehrerer inhärenter Vorteile gegenüber pixelbasierten Ansätzen trotz gelegentlich suboptimaler Leistung erhebliche Aufmerksamkeit in der Wissenschaftsgemeinschaft gefunden. Insbesondere zeichnet sich PAD durch eine reduzierte rechnerische Komplexität, die intrinsische Erhaltung der Privatsphäre und die Milderung von Bedenken bezüglich Diskriminierung und Vorurteilen gegen bestimmte demografische Gruppen aus. In dieser Arbeit wird TSGAD vorgestellt, ein neues menschenzentriertes Zweiströmen-Graphverbesserungsverfahren zur Anomalieerkennung, das Variationsautoencoder (VAEs) und Trajektorienprognose nutzt. TSGAD zielt darauf ab, die Möglichkeit zu erforschen, VAEs als neuen Ansatz für posebasierte menschenzentrierte VAD einzusetzen, wobei gleichzeitig die Vorteile der Trajektorienprognose genutzt werden. Wir zeigen die Effektivität von TSGAD durch umfassende Experimente an Standard-Datensätzen. TSGAD erzielt vergleichbare Ergebnisse mit den neuesten Methoden, was das Potenzial der Verwendung von variationsautoencoder unterstreicht. Dies deutet auf eine vielversprechende Richtung für zukünftige Forschungsanstrengungen hin. Der Quellcode dieser Arbeit ist unter https://github.com/TeCSAR-UNCC/TSGAD verfügbar.