ShareCMP : Segmentation sémantique RGB-P sensible à la polarisation

La segmentation sémantique multimodale connaît un développement rapide, mais le modalité RGB-Polarisation reste largement sous-exploitée. Pour approfondir ce problème, nous avons construit un benchmark UPLight RGB-P comprenant 12 classes sémantiques typiques sous-marines. Dans ce travail, nous proposons ShareCMP, un cadre de segmentation sémantique RGB-P reposant sur une architecture à double branche partagée, qui réduit le nombre de paramètres d’environ 26 à 33 % par rapport aux modèles précédents à double branche. Ce cadre intègre un module appelé Polarization Generate Attention (PGA), conçu pour générer des images de modalité polarisation riches en propriétés polarimétriques, destinées à l’encodeur. Par ailleurs, nous introduisons une fonction de perte nommée Class Polarization-Aware Loss (CPALoss), permettant d’améliorer l’apprentissage et la compréhension par l’encodeur des informations relatives à la modalité polarisation, tout en optimisant le module PGA. Des expériences étendues menées sur trois benchmarks RGB-P distincts montrent que ShareCMP atteint des performances de pointe en termes de mIoU, avec un nombre réduit de paramètres, sur les jeux de données UPLight (92,45 % (+0,32 %)), ZJU (92,7 % (+0,1 %)) et MCubeS (50,99 % (+1,51 %)), surpassant ainsi les méthodes précédentes. Le code source est disponible à l’adresse suivante : https://github.com/LEFTeyex/ShareCMP.