VAD: Vektorisierte Szenerendarstellung für effizientes autonomes Fahren

Autonome Fahrt erfordert ein umfassendes Verständnis der Umgebung für eine zuverlässige Trajektorienplanung. Frühere Arbeiten basieren auf dicht rasterisierten Szenendarstellungen (z.B. Agentenbesetzung und semantischer Karte), um die Planung durchzuführen, was rechenintensiv ist und Informationen zur Struktur auf Instanzenebene verliert. In diesem Artikel schlagen wir VAD vor, ein end-to-end vektorisiertes Paradigma für autonome Fahrzeuge, das die Fahrzeugumgebung als vollständig vektorisierte Darstellung modelliert. Das vorgeschlagene vektorisierte Paradigma hat zwei wesentliche Vorteile. Zum einen nutzt VAD die vektorisierten Bewegungen der Agenten und Kartelemente als explizite planungsbezogene Restriktionen auf Instanzenebene, was die Planungssicherheit erheblich verbessert. Zum anderen läuft VAD viel schneller als frühere end-to-end Planungsmethoden, indem es rechenintensive rasterisierte Darstellungen und manuell entworfene Nachbearbeitungsschritte eliminiert. VAD erreicht den aktuellen Stand der Technik in Bezug auf end-to-end Planungsleistung im nuScenes-Datensatz und übertrifft die bisher beste Methode deutlich. Unser Basismodell, VAD-Base, reduziert den durchschnittlichen Kollisionsrate um 29,0 % und läuft 2,5-mal schneller. Darüber hinaus verbessert eine leichtgewichtige Variante, VAD-Tiny, die Inferenzgeschwindigkeit (bis zu 9,3-mal) erheblich, während sie vergleichbare Planungsleistungen erzielt. Wir sind der Überzeugung, dass die ausgezeichnete Leistung und die hohe Effizienz von VAD entscheidend für die praktische Einführung eines autonomen Fahrzeugsystems sind. Der Quellcode und die Modelle sind unter https://github.com/hustvl/VAD verfügbar, um zukünftige Forschungen zu fördern.