HyperAIHyperAI

Command Palette

Search for a command to run...

REALM : Pré-entraînement des modèles linguistiques augmentés par récupération

Kelvin Guu Kenton Lee Zora Tung Panupong Pasupat Ming-Wei Chang

Résumé

La pré-formation des modèles de langage s'est révélée capable de capturer une quantité surprenante de connaissances mondiales, essentielles pour des tâches de traitement du langage naturel telles que la réponse aux questions. Toutefois, ces connaissances sont stockées de manière implicite dans les paramètres d’un réseau neuronal, ce qui nécessite des réseaux de plus en plus volumineux pour couvrir un plus grand nombre de faits.Afin de capturer ces connaissances de manière plus modulaire et interprétable, nous enrichissons la pré-formation des modèles de langage avec un récupérateur de connaissances latent, permettant au modèle de récupérer et d’atténuer des documents provenant d’un grand corpus tel que Wikipedia, durant la pré-formation, la fine-tuning et l’inférence. Pour la première fois, nous montrons comment pré-entraîner un tel récupérateur de manière non supervisée, en utilisant le modèle de langage masqué comme signal d’apprentissage et en effectuant la rétropropagation à travers une étape de récupération prenant en compte des millions de documents.Nous démontrons l’efficacité de la pré-formation des modèles de langage augmentée par la récupération (REALM) en la fine-tunant sur la tâche exigeante de réponse aux questions dans un domaine ouvert (Open-QA). En la comparant aux meilleurs modèles actuels, qu’ils stockent explicitement ou implicitement les connaissances, sur trois benchmarks populaires de Open-QA, nous constatons que notre approche dépasse toutes les méthodes précédentes avec une marge significative (de 4 à 16 % de précision absolue), tout en offrant des avantages qualitatifs tels qu’une meilleure interprétabilité et une architecture modulaire.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp