HyperAIHyperAI
vor 18 Tagen

Generierung dynamischer Kerne mittels Transformers für die Spurerkennung

{Kate Smith-Miles, Guoqi Qian, Bo Du, Mingming Gong, Yu Liu, Ziye Chen}
Generierung dynamischer Kerne mittels Transformers für die Spurerkennung
Abstract

Zustandsbestimmende Verfahren zur Spurdetektion setzen oft spezifisches Wissen über Spuren voraus – beispielsweise Geraden oder parametrische Kurven –, um Spurstriche zu erkennen. Obwohl dieses spezifische Wissen den Modellierungsprozess vereinfacht, stellt es Herausforderungen bei der Behandlung von Spurstrichen mit komplexen Topologien (z. B. dicht, verzweigt, stark gekrümmt usw.) dar. In jüngster Zeit haben dynamische Faltungsverfahren vielversprechende Leistungen gezeigt, indem sie Merkmale aus bestimmten Schlüsselpositionen einer Spur, wie beispielsweise dem Startpunkt, als Faltungs-Kerne nutzen und diese mit dem gesamten Merkmalsbild falten, um Spurstriche zu detektieren. Obwohl solche Ansätze die Abhängigkeit von spezifischem Wissen reduzieren, können die aus den Schlüsselpositionen berechneten Kerne aufgrund der langen und schmalen Struktur der Spur die globale Struktur der Spur nicht hinreichend erfassen, was zu ungenauen Erkennungen von Spurstrichen mit komplexen Topologien führt. Zudem sind die aus Schlüsselpositionen resultierenden Kerne empfindlich gegenüber Verdeckung und Spurkreuzungen. Um diese Einschränkungen zu überwinden, schlagen wir eine transformerbasierte Architektur zur dynamischen Kernegenerierung für die Spurdetektion vor. Diese nutzt einen Transformer, um für jede Spur in dem Eingabebild dynamische Faltungs-Kerne zu generieren, die anschließend zur Detektion der Spuren mittels dynamischer Faltung eingesetzt werden. Im Gegensatz zu Kernen, die aus Schlüsselpositionen einer Spur abgeleitet werden, können die durch den Transformer generierten Kerne die globale Struktur der Spur aus dem gesamten Merkmalsbild erfassen, wodurch sie effektiv mit Verdeckungen und Spurstrichen mit komplexen Topologien umgehen können. Wir evaluieren unsere Methode an drei gängigen Benchmarks zur Spurdetektion, wobei die Ergebnisse eine state-of-the-art-Leistung belegen. Insbesondere erreicht unsere Methode auf OpenLane einen F1-Score von 63,40 und auf CurveLanes von 88,47, was die bisherigen Bestwerte um 4,30 beziehungsweise 2,37 Punkte übertrifft.