CE-VAE : Capsule Enhanced Variational AutoEncoder pour l'Amélioration des Images Sous-marines

L'analyse d'images sous-marines non pilotées pour la surveillance des océans est confrontée à deux défis majeurs : (i) la dégradation de la qualité des images due à l'atténuation de la lumière et (ii) les contraintes de stockage matériel limitant la collecte d'images en haute résolution. Les méthodes existantes s'attaquent principalement à l'amélioration des images avec des approches qui reposent sur le stockage de l'image d'entrée en taille réelle. En revanche, nous présentons le Capsule Enhanced Variational AutoEncoder (CE-VAE), une nouvelle architecture conçue pour compacter efficacement et améliorer les images sous-marines dégradées. Notre encodeur d'images sensible à l'attention peut projeter l'image d'entrée sur une représentation dans un espace latent tout en étant capable de fonctionner en ligne sur un appareil distant. La seule information qui doit être stockée sur l'appareil ou transmise à une balise est une représentation compressée. Un module décodeur double effectue la génération hors ligne d'images améliorées en taille réelle. Une branche reconstruit les détails spatiaux à partir de l'espace latent compressé, tandis que la seconde branche utilise une couche de clustering de capsules pour capturer les structures au niveau des entités et les relations spatiales complexes. Cette stratégie de décodage parallèle permet au modèle de concilier la préservation des détails fins avec les améliorations contextuelles. Le CE-VAE atteint des performances de pointe dans l'amélioration des images sous-marines sur six jeux de données de référence, offrant jusqu'à trois fois plus d'efficacité en compression que les approches actuelles. Le code source est disponible à l'adresse \url{https://github.com/iN1k1/ce-vae-underwater-image-enhancement}.