HyperAIHyperAI

Command Palette

Search for a command to run...

Re2G : Récupérer, Reclassement, Générer

Michael Glass Gaetano Rossiello Md Faisal Mahbub Chowdhury Ankita Rajaram Naik Pengshan Cai Alfio Gliozzo

Résumé

Comme le montrent GPT-3 et T5, les transformers gagnent en capacité lorsque l'espace de paramètres s'élargit de plus en plus. Cependant, pour les tâches nécessitant une grande quantité de connaissances, la mémoire non paramétrique permet aux modèles de croître considérablement avec une augmentation sous-linéaire des coûts de calcul et des exigences en mémoire GPU. Des modèles récents comme RAG et REALM ont intégré la recherche d'information à la génération conditionnelle. Ces modèles incorporent une recherche initiale neuronale dans un corpus de passages. Nous nous appuyons sur cette ligne de recherche en proposant Re2G, qui combine à la fois la recherche initiale neuronale et le reranking dans une génération séquence-à-séquence basée sur BART. Notre approche de reranking permet également de fusionner les résultats de recherche provenant de sources ayant des scores incomparables, ce qui facilite l'utilisation conjointe du BM25 et de la recherche initiale neuronale. Pour entraîner notre système dans son ensemble, nous introduisons une nouvelle variation du distillation de connaissances afin d'entraîner la recherche initiale, le reranker et la génération en utilisant uniquement des données vérités terrain sur la séquence cible générée. Nous constatons d'importants gains dans quatre tâches variées : le remplissage de slots à vue zéro (zero-shot slot filling), le questionnement-réponse (question answering), le vérification des faits (fact-checking) et le dialogue, avec des gains relatifs allant de 9% à 34% par rapport à l'état de l'art précédent sur le classement KILT. Nous mettons notre code à disposition sous licence open source à l'adresse suivante : https://github.com/IBM/kgi-slot-filling/tree/re2g.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
Re2G : Récupérer, Reclassement, Générer | Articles | HyperAI