HyperAIHyperAI
il y a 17 jours

Récupération augmentée par génération pour la réponse à des questions dans un domaine ouvert

Yuning Mao, Pengcheng He, Xiaodong Liu, Yelong Shen, Jianfeng Gao, Jiawei Han, Weizhu Chen
Récupération augmentée par génération pour la réponse à des questions dans un domaine ouvert
Résumé

Nous proposons une méthode appelée Generation-Augmented Retrieval (GAR) pour répondre à des questions dans un domaine ouvert, qui enrichit une requête en générant du texte à partir de contextes pertinents découverts heuristiquement, sans recourir à des ressources externes pour la supervision. Nous démontrons que les contextes générés enrichissent significativement le sens des requêtes, et que GAR combiné à des représentations creuses (BM25) atteint des performances comparables ou supérieures à celles des méthodes de récupération denses de pointe, telles que DPR. Nous montrons qu’il est avantageux de générer plusieurs contextes diversifiés pour une même requête, car la fusion de leurs résultats conduit de manière cohérente à une meilleure précision en récupération. En outre, puisque les représentations creuses et denses sont souvent complémentaires, GAR peut être facilement combiné à DPR afin d’obtenir des performances encore supérieures. GAR atteint des performances de pointe sur les jeux de données Natural Questions et TriviaQA dans un cadre de question-réponse extraitive lorsqu’il est couplé à un lecteur extraitif, et surpasse de manière cohérente les autres méthodes de récupération lorsque le même lecteur génératif est utilisé.

Récupération augmentée par génération pour la réponse à des questions dans un domaine ouvert | Articles de recherche récents | HyperAI