HyperAIHyperAI
vor 17 Tagen

Spurserkennung mit vielseitigem AtrousFormer und lokaler semantischer Führung

Jiaxing Yang, Lihe Zhang, Huchuan Lu
Spurserkennung mit vielseitigem AtrousFormer und lokaler semantischer Führung
Abstract

Die Spurverfolgung ist eine der zentralen Funktionen im autonomen Fahren und hat in letzter Zeit erhebliche Aufmerksamkeit erfahren. Netzwerke zur Segmentierung von Spurinstanzen, insbesondere bei schlechtem Erscheinungsbild, müssen in der Lage sein, Eigenschaften der Spurdistribution zu erfassen. Die meisten bestehenden Ansätze stützen sich auf CNN-basierte Techniken. Einige wenige haben kürzlich versucht, den neuartigen, beliebten seq2seq-Transformer \cite{transformer} einzubinden. Allerdings behindern deren inhärente Nachteile – insbesondere die schwache Fähigkeit zur globalen Informationsgewinnung und der exzessiv hohe Rechenaufwand – eine breitere Anwendung. In dieser Arbeit stellen wir den Atrous Transformer (AtrousFormer) vor, um dieses Problem zu lösen. Seine Variante, der lokale AtrousFormer, wird in den Merkmalsextraktor eingebettet, um die Merkmalsextraktion zu verbessern. Durch die gezielte Informationsgewinnung zunächst zeilenweise und anschließend spaltenweise wird dem Netzwerk eine stärkere Fähigkeit zur Informationsauswertung sowie eine bessere Recheneffizienz verliehen. Um die Leistung weiter zu steigern, schlagen wir zudem einen lokal semantikgeleiteten Decoder vor, der die Identitäten und Formen der Spuren präziser erfasst. Hierbei dient die vorhergesagte Gauß-Map des Startpunkts jeder Spur als Leitfaden für den Dekodierungsprozess. Umfangreiche Ergebnisse auf drei anspruchsvollen Benchmark-Datenbanken (CULane, TuSimple und BDD100K) zeigen, dass unser Netzwerk die derzeitigen State-of-the-Art-Methoden übertrifft.