Menschliche Trajektorien-Vorhersage in Menschenmengen: Ein tiefes Lernen-basierter Ansatz

Seit den letzten Jahrzehnten ist die Vorhersage menschlicher Bewegungstrajektorien ein aktives Forschungsfeld, bedingt durch zahlreiche praktische Anwendungen wie die Analyse von Evakuierungssituationen, die Implementierung intelligenter Verkehrssysteme sowie die Steuerung von Verkehrsoperationen. Frühere Ansätze basierten auf handwerklichen Darstellungen, die auf fachlichem Wissen beruhten. Doch soziale Interaktionen in überfüllten Umgebungen sind nicht nur vielfältig, sondern oft subtil. In jüngster Zeit haben tiefgreifende Lernmethoden ihre handwerklichen Vorgänger überflügelt, da sie menschliche Interaktionen auf eine allgemeinere, datengetriebene Weise erlernen können. In dieser Arbeit präsentieren wir eine detaillierte Analyse bestehender, auf tiefem Lernen basierender Methoden zur Modellierung sozialer Interaktionen. Wir schlagen zwei wissensbasierte, datengetriebene Ansätze vor, um diese Interaktionen effektiv zu erfassen. Um die Leistungsfähigkeit dieser interaktionsbasierten Vorhersagemodelle objektiv vergleichen zu können, entwickeln wir einen großskaligen, interaktionszentrierten Benchmark namens TrajNet++, ein bedeutender, bisher fehlender Baustein im Bereich der Vorhersage menschlicher Trajektorien. Zudem schlagen wir neuartige Bewertungsmaße vor, die die Fähigkeit eines Modells zur Generierung sozial akzeptabler Trajektorien evaluieren. Experimente auf TrajNet++ bestätigen die Notwendigkeit unserer vorgeschlagenen Metriken, und unsere Methode erreicht eine überlegene Leistung gegenüber etablierten Baseline-Modellen sowohl auf realen als auch auf synthetischen Datensätzen.