Soulevez-vous : génération de texte améliorée par récupération avec mémoire auto-référente

Grâce à un accès direct aux références rédigées par des humains, considérées comme une mémoire, la génération augmentée par récupération a connu des progrès significatifs dans un large éventail de tâches de génération de texte. Étant donné qu’une mémoire de meilleure qualité entraîne typiquement une meilleure génération (que nous définissons comme le problème fondamental), l’approche traditionnelle de récupération de mémoire consiste à sélectionner les éléments de mémoire présentant la plus grande similarité avec l’entrée. Toutefois, cette méthode est limitée par la qualité du corpus fixe à partir duquel la mémoire est extraite. Dans cet article, en explorant la dualité du problème fondamental — une meilleure génération peut également conduire à une meilleure mémoire —, nous proposons un cadre novateur, appelé selfmem, qui surmonte cette limitation en itérativement utilisant un générateur augmenté par récupération pour créer un pool de mémoire illimité, et en employant un sélecteur de mémoire pour choisir une sortie comme mémoire pour le cycle de génération suivant. Cela permet au modèle de tirer parti de ses propres sorties, appelées ici « mémoire auto-référente », afin d’améliorer la génération. Nous évaluons l’efficacité de selfmem sur trois tâches distinctes de génération de texte : la traduction automatique par réseaux neuronaux, la synthèse abstraite de texte et la génération de dialogues, dans deux paradigmes de génération : modèle petit ajusté fine et modèle LLM en peu d’exemples. Notre approche atteint des résultats de pointe dans quatre directions sur les jeux de données JRC-Acquis, XSum (50,3 ROUGE-1) et BigPatent (62,9 ROUGE-1), démontrant le potentiel de la mémoire auto-référente pour améliorer les modèles de génération augmentée par récupération. En outre, nous menons des analyses approfondies de chaque composant du cadre selfmem afin d’identifier les goulets d’étranglement et de fournir des pistes pour la recherche future.