Command Palette
Search for a command to run...
HiVT: Hierarchical Vector Transformer für die Mehr-Agenten-Bewegungsvorhersage
HiVT: Hierarchical Vector Transformer für die Mehr-Agenten-Bewegungsvorhersage
Kejie Lu Kui Wu JianPing Wang Luyao Ye Zikang Zhou
Zusammenfassung
Die präzise Vorhersage der zukünftigen Bewegungen umgebender Verkehrsakteure ist entscheidend für die Sicherheit autonomer Fahrzeuge. In letzter Zeit haben vektorbasierte Ansätze die Bewegungsvorhersage-Community dominiert, da sie in der Lage sind, komplexe Wechselwirkungen in Verkehrsszenen zu erfassen. Dennoch vernachlässigen bestehende Methoden die Symmetrien des Problems und leiden unter hohen Rechenkosten, was die Herausforderung darstellt, Echtzeit-Vorhersagen für mehrere Agenten zu ermöglichen, ohne die Vorhersagegenauigkeit zu beeinträchtigen. Um diese Herausforderung zu meistern, schlagen wir den Hierarchical Vector Transformer (HiVT) für eine schnelle und genaue Mehragenten-Bewegungsvorhersage vor. Durch die Aufteilung des Problems in lokale Kontextextraktion und globale Interaktionsmodellierung kann unsere Methode eine große Anzahl von Agenten effizient und effektiv modellieren. Gleichzeitig führen wir eine translationsinvariante Szenendarstellung und rotationsinvariante räumliche Lernmodule ein, die robuste Merkmale gegenüber geometrischen Transformationen der Szene extrahieren und es dem Modell ermöglichen, in einem einzigen Vorwärtsdurchlauf präzise Vorhersagen für mehrere Agenten zu treffen. Experimente zeigen, dass HiVT auf dem Argoverse-Bewegungsvorhersage-Testbenchmark die bisher beste Leistung erzielt, dabei jedoch einen geringen Modellumfang aufweist und schnelle Mehragenten-Bewegungsvorhersagen ermöglicht.