HyperAIHyperAI

Command Palette

Search for a command to run...

Reconnaissance de Situations Ancrées avec des Transformers

junhyeong Cho*1 [email protected] Youngseok Yoon*1 [email protected] Hyeonjun Lee*2 [email protected] Suha Kwak1,2 [email protected]

Résumé

La Reconnaissance de Situation Ancrée (GSR) est une tâche qui ne se contente pas de classifier une action saillante (verbe), mais prédit également les entités (noms) associées aux rôles sémantiques et leurs emplacements dans l'image donnée. Inspirés par le succès remarquable des Transformers dans les tâches de vision, nous proposons un modèle GSR basé sur une architecture encodeur-décodeur de Transformer. Le mécanisme d'attention de notre modèle permet une classification précise des verbes en capturant efficacement les caractéristiques sémantiques de haut niveau d'une image, et permet au modèle de gérer de manière flexible les relations complexes et dépendantes de l'image entre les entités, améliorant ainsi la classification et la localisation des noms. Notre modèle est la première architecture Transformer pour la GSR, et il atteint l'état de l'art dans toutes les métriques d'évaluation sur le benchmark SWiG. Notre code est disponible à l'adresse suivante : https://github.com/jhcho99/gsrtr .


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp