HyperAIHyperAI
vor 2 Monaten

Ein Blick in die Zukunft: Vorhersage zukünftiger Personenaktivitäten und -orte in Videos

Junwei Liang; Lu Jiang; Juan Carlos Niebles; Alexander Hauptmann; Li Fei-Fei
Ein Blick in die Zukunft: Vorhersage zukünftiger Personenaktivitäten und -orte in Videos
Abstract

Das Entschlüsseln menschlichen Verhaltens zur Vorhersage zukünftiger Bewegungspfade/Trajektorien und der damit verbundenen Handlungen aus Videos ist für viele Anwendungen von großer Bedeutung. Ausgehend von dieser Erkenntnis untersucht diese Arbeit die gemeinsame Vorhersage des zukünftigen Pfades eines Fußgängers sowie seiner zukünftigen Aktivitäten. Wir schlagen ein System zum end-to-end-Mehrfachlernen (multi-task learning) vor, das reichhaltige visuelle Merkmale über menschliches Verhalten und dessen Interaktion mit der Umgebung nutzt. Um das Training zu erleichtern, wird das Netzwerk mit einer zusätzlichen Aufgabe trainiert, den Ort zuvorzusagen, an dem die Aktivität stattfinden wird. Die experimentellen Ergebnisse zeigen unsere Stand-der-Technik-Leistung auf zwei öffentlichen Benchmarks bei der Vorhersage zukünftiger Trajektorien. Darüber hinaus ist unsere Methode in der Lage, sinnvolle Vorhersagen über zukünftige Aktivitäten neben dem Pfad zu erzeugen. Das Resultat liefert erstmals empirische Beweise dafür, dass die gemeinsame Modellierung von Pfaden und Aktivitäten die Vorhersage zukünftiger Pfade verbessert.

Ein Blick in die Zukunft: Vorhersage zukünftiger Personenaktivitäten und -orte in Videos | Neueste Forschungsarbeiten | HyperAI