Command Palette
Search for a command to run...
Récupération d'Images Composées pour la Télédétection
Récupération d'Images Composées pour la Télédétection
Bill Psomas Ioannis Kakogeorgiou Nikos Efthymiadis Giorgos Tolias Ondřej Chum Yannis Avrithis Konstantinos Karantzalos
Résumé
Ce travail introduit la recherche d'images composites dans le domaine de la télédétection. Il permet de consulter un vaste archive d'images en utilisant des exemples d'images alternés avec une description textuelle, ce qui enrichit la puissance descriptive par rapport aux requêtes unimodales, que celles-ci soient visuelles ou textuelles. La partie textuelle peut modifier divers attributs tels que la forme, la couleur ou le contexte. Une nouvelle méthode fusionnant la similarité image-à-image et texte-à-image est présentée. Nous démontrons qu'un modèle vision-langage possède une puissance descriptive suffisante et qu'aucune étape supplémentaire d'apprentissage ni de données d'entraînement n'est nécessaire. Nous proposons un nouveau banc d'évaluation axé sur les modifications de couleur, de contexte, de densité, d'existence, de quantité et de forme. Notre travail ne seulement établit l'état de l'art pour cette tâche, mais constitue également une étape fondamentale pour combler un vide dans le domaine de la recherche d'images en télédétection. Code disponible à : https://github.com/billpsomas/rscir