HyperAIHyperAI

Command Palette

Search for a command to run...

Réseau structuré en graphe pour l'appariement image-texte

Chunxiao Liu Zhendong Mao Tianzhu Zhang Hongtao Xie Bin Wang Yongdong Zhang

Résumé

La correspondance image-texte a suscité un intérêt croissant depuis qu’elle permet de relier vision et langage. Le défi majeur réside dans la manière d’apprendre la correspondance entre image et texte. Les travaux existants s’appuient sur des statistiques de co-occurrence d’objets pour apprendre une correspondance grossière, tout en échouant à capturer une correspondance fine au niveau des phrases. Dans cet article, nous proposons un nouveau réseau de correspondance structuré en graphe (GSMN) afin d’apprendre une correspondance fine. Le GSMN modélise explicitement les objets, les relations et les attributs comme une phrase structurée, ce qui permet non seulement d’apprendre séparément les correspondances des objets, des relations et des attributs, mais aussi de favoriser l’apprentissage de correspondances fines au niveau de phrases structurées. Cela est réalisé grâce à une correspondance au niveau des nœuds et une correspondance au niveau de la structure. La correspondance au niveau des nœuds associe chaque nœud (qui peut être un objet, une relation ou un attribut) à ses nœuds pertinents provenant de l’autre modalité. Ces nœuds associés infèrent ensuite conjointement la correspondance fine en combinant les associations de voisinage au niveau de la structure. Des expériences approfondies montrent que le GSMN surpasse les méthodes de pointe sur des benchmarks, avec des améliorations relatives de rappel@1 de près de 7 % et 2 % respectivement sur Flickr30K et MSCOCO. Le code sera publié à l’adresse suivante : https://github.com/CrossmodalGroup/GSMN.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp