HyperAIHyperAI

Command Palette

Search for a command to run...

Récupération d'Images Composées pour la Conversion de Domaine sans Apprentissage Supervisé

Nikos Efthymiadis extsuperscript1 extsuperscript* Bill Psomas extsuperscript1,2 Zakaria Laskar extsuperscript1 Konstantinos Karantzalos extsuperscript2 Yannis Avrithis extsuperscript3 Ondřej Chum extsuperscript1 Giorgos Tolias extsuperscript1

Résumé

Ce travail aborde la recherche d'images composites dans le contexte de conversion de domaine, où le contenu d'une image de requête est récupéré dans le domaine spécifié par le texte de la requête. Nous démontrons qu'un modèle vision-langage puissant fournit une capacité descriptive suffisante sans entraînement supplémentaire. L'image de requête est mappée vers l'espace d'entrée textuel à l'aide de l'inversion textuelle. Contrairement aux pratiques courantes qui inversent dans l'espace continu des jetons textuels, nous utilisons l'espace discret des mots via une recherche du plus proche voisin dans un vocabulaire textuel. Grâce à cette inversion, l'image est doucement mappée à travers le vocabulaire et rendue plus robuste grâce à une augmentation basée sur la recherche. Les images de la base de données sont récupérées par un ensemble pondéré de requêtes textuelles combinant les mots mappés avec le texte du domaine. Notre méthode surpasse largement les travaux antérieurs sur des benchmarks standards et récemment introduits. Code : https://github.com/NikosEfth/freedom


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp