Apprentissage par contraste pour la détection de lignes par similitude croisée

La détection des marques de chaussée dans les scènes routières constitue un défi en raison de leur nature complexe, qui est particulièrement sensible aux conditions défavorables. Bien que les marques de chaussée présentent des priorités de forme fortes, leur visibilité est facilement compromise par des conditions d’éclairage défavorables, des occultations par d’autres véhicules ou piétons, ainsi que par le décoloration progressive des couleurs au fil du temps. Le processus de détection est encore plus compliqué par la présence de plusieurs formes de lignes et de variations naturelles, ce qui nécessite une quantité importante de données pour entraîner un modèle robuste capable de gérer divers scénarios. Dans cet article, nous proposons une nouvelle méthode d’apprentissage auto-supervisé, dénommée Contrastive Learning for Lane Detection via cross-similarity (CLLD), visant à renforcer la résilience des modèles de détection des lignes dans des situations réelles, notamment lorsque la visibilité des lignes est altérée. CLLD introduit une méthode d’apprentissage contrastif (CL) qui évalue la similarité des caractéristiques locales dans le contexte global de l’image d’entrée. Elle exploite les informations environnantes pour prédire les marques de chaussée. Cela est réalisé en combinant l’apprentissage contrastif des caractéristiques locales avec une opération de cross-similarité que nous proposons. L’apprentissage contrastif local se concentre sur l’extraction de caractéristiques à partir de petites régions, une exigence essentielle pour une localisation précise des segments de lignes. Parallèlement, la cross-similarité capture des caractéristiques globales, permettant ainsi la détection des segments de lignes partiellement masqués grâce à leur environnement. Nous améliorons la cross-similarité en masquant aléatoirement des parties de l’image d’entrée durant le processus d’augmentation. Des expériences étendues sur les benchmarks TuSimple et CuLane montrent que CLLD surpasse les méthodes d’apprentissage contrastif de l’état de l’art, en particulier dans des conditions de visibilité réduite telles que les ombres, tout en offrant des résultats comparables dans des conditions normales. Par rapport à l’apprentissage supervisé, CLLD se distingue encore davantage dans des scénarios difficiles tels que les ombres ou les scènes surchargées, qui sont fréquents dans les situations de conduite réelle.