Kontrastive Lernens für die Spurerkennung mittels Kreuz-Ähnlichkeit

Die Erkennung von Fahrstreifenmarkierungen in Straßenzenen stellt aufgrund ihrer komplexen Struktur und ihrer Anfälligkeit gegenüber ungünstigen Bedingungen eine Herausforderung dar. Obwohl Fahrstreifenmarkierungen starke geometrische Prioritäten aufweisen, ist ihre Sichtbarkeit leicht durch Lichtverhältnisse, Verdeckung durch andere Fahrzeuge oder Fußgänger sowie durch Farbverbleich im Laufe der Zeit beeinträchtigt. Die Erkennung wird zudem durch die Vielzahl möglicher Fahrstreifenformen und natürlicher Variationen erschwert, was eine große Menge an Daten erfordert, um ein robustes Modell für die Fahrstreifenerkennung zu trainieren, das verschiedene Szenarien bewältigen kann. In diesem Artikel präsentieren wir eine neuartige selbstüberwachte Lernmethode namens Contrastive Learning for Lane Detection via cross-similarity (CLLD), die die Robustheit von Fahrstreifenerkennungsmodellen in realen Szenarien erhöht, insbesondere dann, wenn die Sichtbarkeit von Fahrstreifen eingeschränkt ist. CLLD führt eine kontrastive Lernmethode (CL) ein, die die Ähnlichkeit lokaler Merkmale im globalen Kontext des Eingabebildes bewertet und mithilfe der Umgebungsinformationen Fahrstreifenmarkierungen vorhersagt. Dies wird erreicht, indem lokales Merkmalskontrastlernen mit unserer vorgeschlagenen cross-similarity-Operation kombiniert wird. Das lokale Merkmalskontrastlernen konzentriert sich auf die Extraktion von Merkmalen aus kleinen Bildpatches, was für die präzise Lokalisierung von Fahrstreifenabschnitten notwendig ist. Gleichzeitig erfasst die cross-similarity globale Merkmale und ermöglicht die Erkennung verdeckter Fahrstreifenabschnitte anhand ihrer Umgebung. Wir verbessern die cross-similarity durch zufälliges Maskieren von Bildbereichen während des Datenaugmentierungsprozesses. Umfassende Experimente auf den Benchmarks TuSimple und CuLane zeigen, dass CLLD gegenwärtig state-of-the-art (SOTA) kontrastive Lernmethoden übertrifft, insbesondere unter Bedingungen, die die Sichtbarkeit beeinträchtigen, wie Schatten. Gleichzeitig erzielt CLLD auch vergleichbare Ergebnisse unter normalen Bedingungen. Im Vergleich zu überwachtem Lernen übertrifft CLLD weiterhin die Leistung in anspruchsvollen Szenarien wie Schatten und überfüllte Straßen, die in der realen Fahrzeugnutzung häufig auftreten.