TNT: zielgetriebene Trajektorie-Vorhersage

Die Vorhersage des zukünftigen Verhaltens sich bewegender Agenten ist für reale Anwendungen von entscheidender Bedeutung. Dies ist herausfordernd, da die Absichten des Agents und das entsprechende Verhalten unbekannt sind und intrinsisch multimodal sind. Unser zentrales Insight besteht darin, dass sich innerhalb eines moderaten Zeithorizonts die zukünftigen Modi effektiv durch eine Menge von Zielzuständen erfassen lassen. Hieraus ergibt sich unser zielgetriebenes Trajektorievorhersage-Modell (Target-driven Trajectory Prediction, TNT). TNT weist drei Stufen auf, die end-to-end trainiert werden. Zunächst werden die potenziellen Zielzustände eines Agents $T$ Schritte in die Zukunft vorhergesagt, indem dessen Interaktionen mit der Umgebung und anderen Agenten kodiert werden. Anschließend generiert TNT Trajektoriestatusfolgen bedingt auf diese Ziele. In einer finalen Stufe werden die Wahrscheinlichkeiten der Trajektorien geschätzt, und schließlich wird eine kompakte Menge von Trajektorievorhersagen ausgewählt. Dies unterscheidet sich von vorhergehenden Ansätzen, die Agentenabsichten als latente Variablen modellieren und sich bei der Testzeit auf Sampling stützen, um vielfältige Trajektorien zu generieren. Wir evaluieren TNT anhand der Trajektorievorhersage von Fahrzeugen und Fußgängern und erreichen dabei eine bessere Leistung als die derzeitigen State-of-the-Art-Methoden auf den Datensätzen Argoverse Forecasting, INTERACTION, Stanford Drone sowie einem internen Datensatz zu Fußgängern an Kreuzungen.