HyperAIHyperAI

Command Palette

Search for a command to run...

Réseaux d'attention multi-voies pour la modélisation de paires de phrases

Ming Zhou Furu Wei Chuanqi Tan Weifeng Lv Wenhui Wang

Résumé

La modélisation des paires de phrases joue un rôle fondamental dans l’évaluation de la relation entre deux phrases, telles que l’identification de paraphrases, l’inférence linguistique naturelle et la sélection de phrases réponse. Les travaux antérieurs ont obtenu des résultats très prometteurs en utilisant des réseaux neuronaux munis d’un mécanisme d’attention. Dans cet article, nous proposons les réseaux d’attention multi-voies, qui exploitent plusieurs fonctions d’attention pour aligner des paires de phrases dans le cadre de l’alignement-agrégation. Plus précisément, nous concevons quatre fonctions d’attention afin d’aligner les mots correspondants entre deux phrases. Ensuite, nous agrégons les informations d’alignement provenant de chaque fonction, puis combinons ces informations issues de toutes les fonctions pour obtenir une représentation finale. Les résultats expérimentaux démontrent que les réseaux d’attention multi-voies proposés améliorent significativement les performances sur les jeux de données Quora Question Pairs, SNLI, MultiNLI, ainsi que sur la tâche de sélection de phrase réponse du dataset SQuAD.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Réseaux d'attention multi-voies pour la modélisation de paires de phrases | Articles | HyperAI