LaneRCNN: Verteilte Darstellungen für graphzentrierte Bewegungsvorhersage

Die Vorhersage zukünftigen Verhaltens dynamischer Akteure ist eine zentrale Aufgabe in zahlreichen Anwendungen der Robotik, beispielsweise im Bereich autonomes Fahren. Diese Aufgabe ist äußerst herausfordernd, da Akteure latente Absichten verfolgen und ihre Trajektorien durch komplexe Wechselwirkungen untereinander, mit der Umgebung und der Straßenkarte bestimmt werden. In diesem Paper stellen wir LaneRCNN vor, ein graphenzentriertes Modell zur Bewegungsvorhersage. Insbesondere nutzen wir einen speziell entworfenen Graphen-Encoder, um für jeden Akteur eine lokale Straßenbahn-Graph-Darstellung (LaneRoI) zu lernen, die dessen vergangene Bewegungen sowie die Topologie der lokalen Umgebung kodiert. Darüber hinaus entwickeln wir ein Interaktionsmodul, das einen effizienten Informationsaustausch zwischen den lokalen Graphendarstellungen innerhalb eines gemeinsamen globalen Straßenbahn-Graphen ermöglicht. Zudem parametrisieren wir die vorhergesagten Trajektorien direkt anhand von Straßenbahn-Graphen, was eine intuitivere und besser handhabbare Parameterisierung der Vorhersage ergibt. Unser LaneRCNN erfasst die Beziehungen zwischen Akteuren sowie zwischen Akteuren und der Karte auf verteilte und kartenbewusste Weise. Wir belegen die Wirksamkeit unseres Ansatzes am großen Argoverse Motion Forecasting Benchmark. Dabei erreichen wir die Bestplatzierung auf dem Leaderboard und überbieten signifikant die vorherigen besten Ergebnisse.