Focus on Local : Détection des lignes de chaussée par une approche ascendante basée sur les points clés

Les méthodes courantes de détection des marques de voie reposent sur la prédiction de la structure globale, suivie de l'obtention de courbes paramétriques par post-traitement. La modélisation de formes complexes de lignes de voie exige une sortie de haute dimension pour les réseaux de neurones convolutifs (CNN), ce qui augmente considérablement les exigences en capacité du modèle et en données d'entraînement. En revanche, la localité d'une marque de voie présente un nombre fini de variations géométriques et une couverture spatiale limitée. Nous proposons une nouvelle solution de détection des marques de voie, FOLOLane, qui se concentre sur la modélisation des motifs locaux et réalise la prédiction de structures globales de manière descendante (bottom-up). Plus précisément, le CNN modélise des motifs locaux de faible complexité à l’aide de deux têtes distinctes : la première prédit l’existence de points clés, tandis que la seconde affine la position de ces points dans une portée locale et établit des corrélations entre les points clés appartenant à la même ligne de voie. La nature locale de la tâche s’aligne parfaitement avec le champ de vue limité (FOV) des caractéristiques dans les CNN, ce qui conduit à une entraînement plus stable et une meilleure généralisation. Par ailleurs, nous avons également conçu un algorithme de décodage orienté vers l’efficacité, ainsi qu’un algorithme glouton, offrant une réduction de 36 % du temps d’exécution avec une dégradation négligeable des performances. Les deux décodeurs intègrent efficacement les informations locales dans la géométrie globale des marques de voie. Sans recourir à une architecture de réseau complexe, la méthode proposée surpasser largement toutes les approches existantes sur des jeux de données publics, atteignant simultanément les meilleurs résultats actuels de l’état de l’art et un traitement en temps réel.