Récupération d'images avec requête multi-modale
La recherche d'images avec une requête multi-modale fait référence à la tâche de récupérer des images dans une base de données en utilisant à la fois des images et du texte comme entrées de requête. Cette tâche implique d'apporter des modifications spécifiques à l'image de requête en fonction des instructions textuelles, dans le but de récupérer précisément des images qui répondent aux exigences modifiées. Cette technologie présente une valeur d'application importante dans la recherche d'images, les recommandations de contenu et l'édition intelligente, et peut considérablement améliorer l'expérience d'interaction utilisateur et l'efficacité de la recherche.