HyperAIHyperAI

Command Palette

Search for a command to run...

Soulevez-vous : génération de texte améliorée par récupération avec mémoire auto-référente

Xin Cheng Di Luo Xiuying Chen Lemao Liu Dongyan Zhao Rui Yan

Résumé

Grâce à un accès direct aux références rédigées par des humains, considérées comme une mémoire, la génération augmentée par récupération a connu des progrès significatifs dans un large éventail de tâches de génération de texte. Étant donné qu’une mémoire de meilleure qualité entraîne typiquement une meilleure génération (que nous définissons comme le problème fondamental), l’approche traditionnelle de récupération de mémoire consiste à sélectionner les éléments de mémoire présentant la plus grande similarité avec l’entrée. Toutefois, cette méthode est limitée par la qualité du corpus fixe à partir duquel la mémoire est extraite. Dans cet article, en explorant la dualité du problème fondamental — une meilleure génération peut également conduire à une meilleure mémoire —, nous proposons un cadre novateur, appelé selfmem, qui surmonte cette limitation en itérativement utilisant un générateur augmenté par récupération pour créer un pool de mémoire illimité, et en employant un sélecteur de mémoire pour choisir une sortie comme mémoire pour le cycle de génération suivant. Cela permet au modèle de tirer parti de ses propres sorties, appelées ici « mémoire auto-référente », afin d’améliorer la génération. Nous évaluons l’efficacité de selfmem sur trois tâches distinctes de génération de texte : la traduction automatique par réseaux neuronaux, la synthèse abstraite de texte et la génération de dialogues, dans deux paradigmes de génération : modèle petit ajusté fine et modèle LLM en peu d’exemples. Notre approche atteint des résultats de pointe dans quatre directions sur les jeux de données JRC-Acquis, XSum (50,3 ROUGE-1) et BigPatent (62,9 ROUGE-1), démontrant le potentiel de la mémoire auto-référente pour améliorer les modèles de génération augmentée par récupération. En outre, nous menons des analyses approfondies de chaque composant du cadre selfmem afin d’identifier les goulets d’étranglement et de fournir des pistes pour la recherche future.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp