il y a 6 mois

Résumé

La réponse à des questions dans un domaine ouvert a connu une popularité croissante récemment, en raison du succès des modèles de récupération dense, qui surpassent désormais les modèles creux en ne nécessitant qu’un faible nombre d’exemples d’apprentissage supervisé. Toutefois, dans ce papier, nous démontrons que les modèles denses actuels ne constituent pas encore le Graal de la récupération. Nous construisons tout d’abord EntityQuestions, un ensemble de questions simples riches en entités, basées sur des faits provenant de Wikidata (par exemple : « Où Arve Furset est-il né ? »), et constatons que les récupérateurs denses s’effondrent en performance par rapport aux méthodes creuses. Nous explorons ce problème et découvrons que les récupérateurs denses ne parviennent à généraliser qu’aux entités courantes, à moins que le motif de la question n’ait été explicitement observé pendant l’apprentissage. Nous discutons deux solutions simples pour remédier à ce problème critique. Premièrement, nous montrons que l’augmentation de données ne peut pas résoudre le problème de généralisation. Deuxièmement, nous soutenons qu’un encodeur de passages plus robuste permettrait une meilleure adaptation aux questions grâce à l’emploi d’encodeurs de questions spécialisés. Nous espérons que notre travail contribuera à mieux comprendre les défis liés à la création d’un récupérateur dense robuste et universel, performant sur différentes distributions d’entrée.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Réponse Aux Questions Intelligente

Génération Augmentée Par La Recherche

Jeu De Données

Infrastructure D'ia

Approche/Framework

Traitement Du Langage Naturel

Tâche

Christopher Sciavolino Zexuan Zhong Jinhyuk Lee Danqi Chen

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Réponse Aux Questions Intelligente

Génération Augmentée Par La Recherche

Jeu De Données

Infrastructure D'ia

Approche/Framework

Traitement Du Langage Naturel

Tâche

Christopher Sciavolino Zexuan Zhong Jinhyuk Lee Danqi Chen

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Les questions simples centrées sur une entité mettent à l'épreuve les récupérateurs denses

Christopher Sciavolino Zexuan Zhong Jinhyuk Lee Danqi Chen

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Les questions simples centrées sur une entité mettent à l'épreuve les récupérateurs denses

Christopher Sciavolino Zexuan Zhong Jinhyuk Lee Danqi Chen

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Les questions simples centrées sur une entité mettent à l'épreuve les récupérateurs denses

Christopher Sciavolino Zexuan Zhong Jinhyuk Lee Danqi Chen

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters