HyperAIHyperAI

Command Palette

Search for a command to run...

DyREx : Représentation dynamique des requêtes pour la réponse aux questions par extraction

Urchade Zaratiana Niama El Khbir Dennis Núñez Pierre Holat Nadi Tomeh Thierry Charnois

Résumé

La réponse à des questions par extraction (ExQA) est une tâche essentielle en traitement du langage naturel. L'approche dominante en ExQA consiste à représenter les jetons de la séquence d'entrée (question et passage) à l'aide d'un transformateur pré-entraîné, puis à utiliser deux vecteurs d'interrogation appris pour calculer des distributions sur les positions de départ et d'arrivée de l'intervalle de réponse. Ces vecteurs d'interrogation manquent du contexte des entrées, ce qui peut constituer un goulot d'étranglement pour les performances du modèle. Pour remédier à ce problème, nous proposons \textit{DyREx}, une généralisation de l'approche \textit{vanilla} dans laquelle nous calculons dynamiquement les vecteurs d'interrogation en fonction de l'entrée, grâce à un mécanisme d'attention traversant des couches de transformateur. Des observations empiriques montrent que notre approche améliore de manière cohérente les performances par rapport à l'approche standard. Le code et les fichiers associés pour exécuter les expériences sont disponibles à l'adresse \url{https://github.com/urchade/DyReX}.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
DyREx : Représentation dynamique des requêtes pour la réponse aux questions par extraction | Articles | HyperAI