Trajektorievorhersagen in unbekannten Umgebungen bedingt durch gitterbasierte Pläne

Wir behandeln das Problem der Vorhersage von Fußgänger- und Fahrzeugtrajektorien in unbekannten Umgebungen, bedingt durch ihre vergangene Bewegung und die Struktur der Szene. Die Trajektorienvorhersage stellt eine herausfordernde Aufgabe dar, bedingt durch die große Variabilität der Szenestruktur und die multimodale Verteilung zukünftiger Trajektorien. Im Gegensatz zu früheren Ansätzen, die direkt ein ein-zu-viele-Abbildung von beobachteten Kontexten auf mehrere zukünftige Trajektorien lernen, schlagen wir vor, die Trajektorienvorhersage auf Pläne zu bedingen, die aus einer gitterbasierten Policy stammen, die mittels Maximum-Entropy-Inverse-Reinforcement-Learning (MaxEnt IRL) gelernt wurde. Wir reformulieren MaxEnt IRL, um die Policy zu ermöglichen, plausible Agentenziele gemeinsam mit den dazugehörigen Pfaden auf einem groben zweidimensionalen Gitter, das über die Szene definiert ist, abzuleiten. Wir stellen einen auf Aufmerksamkeit basierenden Trajektoriengenerator vor, der kontinuierliche zukünftige Trajektorien erzeugt, bedingt durch Zustandsfolgen, die aus der MaxEnt-Policy abgeleitet wurden. Quantitative und qualitative Evaluierungen an den öffentlich verfügbaren Datensätzen Stanford Drone und NuScenes zeigen, dass unser Modell Trajektorien erzeugt, die vielfältig sind und die multimodale Vorhersagedichte repräsentieren, und gleichzeitig präzise sind und sich über lange Vorhersagehorizonte hinweg der zugrundeliegenden Szenestruktur anpassen.