il y a 6 mois

Résumé

Dans cet article, nous présentons une méthode de recherche d’images conditionnelle et composée fondée sur les caractéristiques CLIP. Dans cette extension de la recherche d’images par contenu (CBIR), une image est associée à un texte qui exprime les intentions de l’utilisateur et est pertinent pour des domaines d’application tels que le commerce électronique. La méthode proposée repose sur une phase initiale d’entraînement, durant laquelle une combinaison simple des caractéristiques visuelles et textuelles est utilisée pour ajuster finement l’encodeur texte de CLIP. Ensuite, lors d’une deuxième phase d’entraînement, nous apprenons un réseau de combinaison plus complexe capable de fusionner les caractéristiques visuelles et textuelles. L’apprentissage contrastif est employé dans les deux phases. L’approche proposée atteint des performances de pointe pour la recherche d’images conditionnelle sur le jeu de données FashionIQ, ainsi que pour la recherche d’images composée sur le jeu de données plus récent CIRR.

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Représentation Multimodale

Multimodal

Vision Par Ordinateur

Multimodal

Vision Par Ordinateur

Tâche

Alberto del Bimbo Tiberio Uricchio Marco Bertini Alberto Baldrati

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Représentation Multimodale

Multimodal

Vision Par Ordinateur

Multimodal

Vision Par Ordinateur

Tâche

Alberto del Bimbo Tiberio Uricchio Marco Bertini Alberto Baldrati

Résumé

PDF source Voir le code

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Récupération d'images conditionnée et composée combinant des caractéristiques CLIP ajustées partiellement et entièrement

Alberto del Bimbo Tiberio Uricchio Marco Bertini Alberto Baldrati

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Récupération d'images conditionnée et composée combinant des caractéristiques CLIP ajustées partiellement et entièrement

Alberto del Bimbo Tiberio Uricchio Marco Bertini Alberto Baldrati

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Récupération d'images conditionnée et composée combinant des caractéristiques CLIP ajustées partiellement et entièrement

Alberto del Bimbo Tiberio Uricchio Marco Bertini Alberto Baldrati

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters