TwinLiteNetPlus : un modèle de segmentation multi-tâches en temps réel pour la conduite autonome

La segmentation sémantique est essentielle pour les véhicules autonomes, en particulier pour les tâches de segmentation de la zone de conduite (Drivable Area) et de la chaussée (Lane Segmentation), garantissant ainsi sécurité et navigation. Afin de répondre aux coûts computationnels élevés des modèles d'état de l'art (SOTA) actuels, ce papier présente TwinLiteNetPlus, un modèle capable d'optimiser l'équilibre entre efficacité et précision. TwinLiteNetPlus intègre des convolutions dilatées standards et séparables en profondeur, réduisant ainsi la complexité tout en préservant une haute précision. Ce modèle est disponible en quatre configurations, allant du modèle robuste TwinLiteNetPlus_{Large} (1,94 million de paramètres) au modèle ultra-léger TwinLiteNetPlus_{Nano} (34 000 paramètres). Notamment, TwinLiteNetPlus_{Large} atteint un mIoU (mean Intersection over Union) de 92,9 % pour la segmentation de la zone de conduite et un IoU de 34,2 % pour la segmentation des voies. Ces résultats démontrent une performance remarquable, dépassant les modèles d'état de l'art actuels tout en nécessitant seulement 11 fois moins d'opérations flottantes (FLOPs) pour le calcul. Évalué rigoureusement sur divers dispositifs embarqués, TwinLiteNetPlus présente des latences et une efficacité énergétique prometteuses, soulignant son potentiel pour les applications réelles dans les véhicules autonomes. Le code est disponible à l'adresse suivante : https://github.com/chequanghuy/TwinLiteNetPlus.