Achelous : Un Cadre Rapide et Unifié de Perception Panoptique des Surfaces d'Eau basé sur la Fusion d'une Caméra Monoculaire et d'un Radar mmWave 4D

Les modèles de perception actuels pour différentes tâches existent généralement sous forme modulaire sur les Véhicules de Surface Non Tripulés (VSNT), effectuant des inférences extrêmement lentes en parallèle sur les dispositifs périphériques, ce qui provoque une asynchronie entre les résultats de perception et la position du VSNT, conduisant à des décisions erronées de navigation autonome. Comparativement aux Véhicules Terrestres Non Tripulés (VTNT), le développement d'une perception robuste pour les VSNT est relativement lent. De plus, la plupart des modèles de perception multitâche actuels sont volumineux en termes de paramètres, lents en inférence et peu évolutifs. À cet égard, nous proposons Achelous, un cadre de perception panoramique unifié à faible coût et rapide pour la perception en surface d'eau, basé sur la fusion d'une caméra monoculaire et d'un radar mmWave 4D. Achelous peut effectuer simultanément cinq tâches : détection et segmentation des cibles visuelles, segmentation des zones de circulation, segmentation de la ligne d'eau et segmentation du nuage de points radar. Par ailleurs, les modèles de la famille Achelous, avec moins d'environ 5 millions de paramètres, atteignent environ 18 images par seconde (FPS) sur une NVIDIA Jetson AGX Xavier, soit 11 FPS plus rapidement que HybridNets, et surpassent YOLOX-Tiny et Segformer-B0 sur notre jeu de données collecté avec environ 5 mAP$_{\text{50-95}}$ et 0,7 mIoU, particulièrement dans des conditions météorologiques défavorables, des environnements sombres et en cas de panne de caméra. Selon nos connaissances, Achelous est le premier cadre panoramique complet combinant des tâches au niveau visuel et au niveau du nuage de points pour la perception en surface d'eau. Pour favoriser le développement de la communauté du transport intelligent, nous mettons nos codes à disposition sur \url{https://github.com/GuanRunwei/Achelous}.