HyperAIHyperAI
il y a 2 mois

Réponse aux Questions Basée sur RAG sur des Données et du Texte Hétérogènes

Philipp Christmann; Gerhard Weikum
Réponse aux Questions Basée sur RAG sur des Données et du Texte Hétérogènes
Résumé

Cet article présente le système QUASAR pour la réponse aux questions sur du texte non structuré, des tables structurées et des graphes de connaissances, avec un traitement unifié de toutes les sources. Le système adopte une architecture basée sur RAG (Retrieval-Augmented Generation), comprenant une chaîne de récupération de preuves suivie d'une génération de réponses, cette dernière étant alimentée par un modèle linguistique de taille modérée. De plus et de manière unique, QUASAR intègre des composants pour la compréhension des questions, afin d'obtenir une entrée plus précise pour la récupération de preuves, ainsi que pour le reclassement et le filtrage des preuves récupérées avant d'alimenter les éléments les plus informatifs dans la génération de réponses. Des expériences menées avec trois différents benchmarks démontrent la haute qualité des réponses fournies par notre approche, qui est comparable ou supérieure à celle des grands modèles GPT, tout en maintenant les coûts computationnels et énergétiques bien inférieurs.

Réponse aux Questions Basée sur RAG sur des Données et du Texte Hétérogènes | Articles de recherche récents | HyperAI