HyperAI

Image Text Matching

L'appariement image-texte est une sous-tâche de la recherche intermodale (CMR) qui vise à établir des associations entre des images et leurs descriptions textuelles correspondantes. Son objectif est de récupérer des images pertinentes à partir d'une requête textuelle, ou de récupérer les descriptions textuelles correspondantes à partir d'une requête d'image. Cette tâche est complexe en raison du fossé de hétérogénéité entre la représentation des données d'images et de texte, et elle est largement utilisée dans les scénarios de recherche d'images basée sur le contenu, de réponse aux questions visuelles et de résumé multimodal.