HyperAIHyperAI

Command Palette

Search for a command to run...

Les questions simples centrées sur une entité mettent à l'épreuve les récupérateurs denses

Christopher Sciavolino Zexuan Zhong Jinhyuk Lee Danqi Chen

Résumé

La réponse à des questions dans un domaine ouvert a connu une popularité croissante récemment, en raison du succès des modèles de récupération dense, qui surpassent désormais les modèles creux en ne nécessitant qu’un faible nombre d’exemples d’apprentissage supervisé. Toutefois, dans ce papier, nous démontrons que les modèles denses actuels ne constituent pas encore le Graal de la récupération. Nous construisons tout d’abord EntityQuestions, un ensemble de questions simples riches en entités, basées sur des faits provenant de Wikidata (par exemple : « Où Arve Furset est-il né ? »), et constatons que les récupérateurs denses s’effondrent en performance par rapport aux méthodes creuses. Nous explorons ce problème et découvrons que les récupérateurs denses ne parviennent à généraliser qu’aux entités courantes, à moins que le motif de la question n’ait été explicitement observé pendant l’apprentissage. Nous discutons deux solutions simples pour remédier à ce problème critique. Premièrement, nous montrons que l’augmentation de données ne peut pas résoudre le problème de généralisation. Deuxièmement, nous soutenons qu’un encodeur de passages plus robuste permettrait une meilleure adaptation aux questions grâce à l’emploi d’encodeurs de questions spécialisés. Nous espérons que notre travail contribuera à mieux comprendre les défis liés à la création d’un récupérateur dense robuste et universel, performant sur différentes distributions d’entrée.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Les questions simples centrées sur une entité mettent à l'épreuve les récupérateurs denses | Articles | HyperAI