HyperAIHyperAI
il y a 2 mois

Récupération d'Images Composées pour la Télédétection

Psomas, Bill ; Kakogeorgiou, Ioannis ; Efthymiadis, Nikos ; Tolias, Giorgos ; Chum, Ondrej ; Avrithis, Yannis ; Karantzalos, Konstantinos
Récupération d'Images Composées pour la Télédétection
Résumé

Ce travail introduit la recherche d'images composites dans le domaine de la télédétection. Il permet de consulter un vaste archive d'images en utilisant des exemples d'images alternés avec une description textuelle, ce qui enrichit la puissance descriptive par rapport aux requêtes unimodales, que celles-ci soient visuelles ou textuelles. La partie textuelle peut modifier divers attributs tels que la forme, la couleur ou le contexte. Une nouvelle méthode fusionnant la similarité image-à-image et texte-à-image est présentée. Nous démontrons qu'un modèle vision-langage possède une puissance descriptive suffisante et qu'aucune étape supplémentaire d'apprentissage ni de données d'entraînement n'est nécessaire. Nous proposons un nouveau banc d'évaluation axé sur les modifications de couleur, de contexte, de densité, d'existence, de quantité et de forme. Notre travail ne seulement établit l'état de l'art pour cette tâche, mais constitue également une étape fondamentale pour combler un vide dans le domaine de la recherche d'images en télédétection. Code disponible à : https://github.com/billpsomas/rscir