Unüberwachte Erkennung von Verkehrsunfällen in Erstperson-Videos

Die Erkennung von abnormen Ereignissen wie Verkehrsverstößen und Unfällen in natürlichen Fahrzeugszenes ist für den erfolgreichen autonomen Fahren und fortgeschrittene Fahrerassistenzsysteme entscheidend. Allerdings leiden die meisten Arbeiten zur Videoanomaliedetektion unter zwei wesentlichen Nachteilen. Erstens gehen sie davon aus, dass Kameras fixiert sind und Videos statische Hintergründe haben, was für Überwachungsanwendungen sinnvoll ist, aber nicht für an Fahrzeugen montierte Kameras. Zweitens formulieren sie das Problem als One-Class-Klassifikation, wobei sie auf mühsam manuell beschriftete Trainingsdatensätze zurückgreifen, die die Erkennung auf Anomaliekategorien begrenzen, die explizit trainiert wurden. In dieser Arbeit schlagen wir einen unüberwachten Ansatz zur Unfallerkennung in Erstpersonvideos (Kamera am Armaturenbrett montiert) vor. Unsere Hauptneuerung besteht darin, Anomalien durch die Vorhersage zukünftiger Positionen von Verkehrsteilnehmern zu erkennen und dann drei verschiedene Strategien zur Überwachung der Vorhersagegenauigkeit und -konsistenz zu verwenden. Wir evaluieren unseren Ansatz mit einem neuen Datensatz vielfältiger Verkehrsunfälle, dem AnAn Accident Detection (A3D)-Datensatz, sowie einem weiteren öffentlich verfügbaren Datensatz. Die experimentellen Ergebnisse zeigen, dass unser Ansatz den aktuellen Stand der Technik übertrifft.