Vielfältige Trajektorienprognose mit Determinantenpunktprozessen

Die Fähigkeit, eine Reihe wahrscheinlicher und dennoch vielfältiger zukünftiger Verhaltensweisen eines Akteurs (z.B. zukünftige Trajektorien eines Fußgängers) vorherzusagen, ist für sicherheitskritische Wahrnehmungssysteme (z.B. autonome Fahrzeuge) von entscheidender Bedeutung. Insbesondere müssen die von dem System erzeugten möglichen zukünftigen Verhaltensweisen vielfältig sein, um alle möglichen Ausgänge zu berücksichtigen und notwendige Sicherheitsvorkehrungen zu treffen. Es reicht nicht aus, nur eine Reihe der wahrscheinlichsten zukünftigen Ausgänge zu verwalten, da diese nur Variationen eines einzigen Ausgangs enthalten können. Obwohl generative Modelle wie variationelle Autoencoder (VAEs) als mächtiges Werkzeug zur Lernkurve einer Verteilung über zukünftige Trajektorien gezeigt wurden, können zufällig gezogene Stichproben aus dem gelernten impliziten Likelihood-Modell nicht vielfältig sein – das Likelihood-Modell leitet sich von der Trainingsdatenverteilung ab und die Stichproben werden sich um den Hauptmodus konzentrieren, der die meisten Daten enthält.In dieser Arbeit schlagen wir vor, eine Vielfalt-Stichprobenfunktion (Diversity Sampling Function, DSF) zu lernen, die eine vielfältige und wahrscheinliche Menge an zukünftigen Trajektorien erzeugt. Die DSF ordnet Kontextmerkmale des Vorhersageproblems einem Satz latenter Codes zu, die durch ein generatives Modell (z.B. VAE) in eine Menge vielfältiger Trajektorienstichproben dekodiert werden können. Konkret wird der Prozess der Identifizierung einer vielfältigen Menge an Stichproben als Parameterschätzung der DSF formuliert. Um die Parameter der DSF zu lernen, wird die Vielfalt der Trajektorienstichproben durch einen Vielfalt-Verlust basierend auf einem Determinantal Point Process (DPP) bewertet. Eine Gradientenabstiegs-Methode wird über die Parameter der DSF durchgeführt, was wiederum dazu führt, dass die latenten Codes des Stichprobensatzes verschoben werden, um eine optimale Menge an vielfältigen und wahrscheinlichen Trajektorien zu finden. Unsere Methode stellt eine neuartige Anwendung von DPPs dar, um eine Menge von Elementen (Trajektorien) im kontinuierlichen Raum zu optimieren. Wir zeigen die Vielfalt der durch unseren Ansatz erzeugten Trajektorien sowohl an niedrigdimensionalen 2D-Trajektoriendaten als auch an hochdimensionalen Bewegungsdaten des Menschen.