il y a 6 mois

Résumé

La correspondance image-texte a suscité un intérêt croissant depuis qu’elle permet de relier vision et langage. Le défi majeur réside dans la manière d’apprendre la correspondance entre image et texte. Les travaux existants s’appuient sur des statistiques de co-occurrence d’objets pour apprendre une correspondance grossière, tout en échouant à capturer une correspondance fine au niveau des phrases. Dans cet article, nous proposons un nouveau réseau de correspondance structuré en graphe (GSMN) afin d’apprendre une correspondance fine. Le GSMN modélise explicitement les objets, les relations et les attributs comme une phrase structurée, ce qui permet non seulement d’apprendre séparément les correspondances des objets, des relations et des attributs, mais aussi de favoriser l’apprentissage de correspondances fines au niveau de phrases structurées. Cela est réalisé grâce à une correspondance au niveau des nœuds et une correspondance au niveau de la structure. La correspondance au niveau des nœuds associe chaque nœud (qui peut être un objet, une relation ou un attribut) à ses nœuds pertinents provenant de l’autre modalité. Ces nœuds associés infèrent ensuite conjointement la correspondance fine en combinant les associations de voisinage au niveau de la structure. Des expériences approfondies montrent que le GSMN surpasse les méthodes de pointe sur des benchmarks, avec des améliorations relatives de rappel@1 de près de 7 % et 2 % respectivement sur Flickr30K et MSCOCO. Le code sera publié à l’adresse suivante : https://github.com/CrossmodalGroup/GSMN.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Représentation Multimodale

Vision Par Ordinateur

Multimodal

Vision Par Ordinateur

Tâche

Chunxiao Liu Zhendong Mao Tianzhu Zhang Hongtao Xie Bin Wang Yongdong Zhang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Représentation Multimodale

Vision Par Ordinateur

Multimodal

Vision Par Ordinateur

Tâche

Chunxiao Liu Zhendong Mao Tianzhu Zhang Hongtao Xie Bin Wang Yongdong Zhang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Réseau structuré en graphe pour l'appariement image-texte | Articles | HyperAI

Command Palette

Réseau structuré en graphe pour l'appariement image-texte

Chunxiao Liu Zhendong Mao Tianzhu Zhang Hongtao Xie Bin Wang Yongdong Zhang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Réseau structuré en graphe pour l'appariement image-texte

Chunxiao Liu Zhendong Mao Tianzhu Zhang Hongtao Xie Bin Wang Yongdong Zhang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Réseau structuré en graphe pour l'appariement image-texte

Chunxiao Liu Zhendong Mao Tianzhu Zhang Hongtao Xie Bin Wang Yongdong Zhang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters