Navire en vue : modèles de diffusion pour la super-résolution d'images de navires

Ces dernières années, des progrès remarquables ont été réalisés dans le domaine de la génération d’images, principalement stimulés par la demande croissante de résultats de haute qualité dans diverses tâches de génération d’images, telles que le remplissage (inpainting), le débruitage (denoising) et la super-résolution. Une importante attention est portée à l’exploration des techniques de super-résolution afin d’améliorer la qualité des images à faible résolution. Dans ce contexte, notre méthode s’attaque en profondeur au problème de la super-résolution d’images de navires, une tâche cruciale pour la surveillance côtière et portuaire. Nous exploitons l’intérêt croissant porté aux modèles de diffusion text-image, en tirant parti des connaissances préalablement acquises par ces modèles fondamentaux. Plus précisément, nous proposons une architecture basée sur les modèles de diffusion qui utilise une condition textuelle pendant l’entraînement tout en étant sensible aux classes, afin de préserver au mieux les détails essentiels des navires lors de la génération d’images à haute résolution. Étant donné la spécificité de cette tâche et la rareté des données disponibles à l’état de l’art, nous introduisons également un grand jeu de données étiqueté d’images de navires, extrait à partir d’images en ligne, principalement provenant du site ShipSpotting\footnote{\url{www.shipspotting.com}}. Notre méthode obtient des résultats plus robustes que les modèles de deep learning précédemment utilisés pour la super-résolution, comme le démontrent plusieurs expérimentations. En outre, nous étudions la manière dont ce modèle peut bénéficier à des tâches en aval, telles que la classification et la détection d’objets, soulignant ainsi son potentiel d’application pratique dans des scénarios réels. Les résultats expérimentaux montrent une grande flexibilité, une fiabilité et des performances remarquables du cadre proposé par rapport aux méthodes de pointe pour différentes tâches. Le code source est disponible à l’adresse suivante : https://github.com/LuigiSigillo/ShipinSight.