HyperAIHyperAI

Command Palette

Search for a command to run...

Affiner l'architecture RAG entière (y compris le module de récupération DPR) pour la réponse aux questions

Shamane Siriwardhana Rivindu Weerasekera Elliott Wen Suranga Nanayakkara

Résumé

Dans cet article, nous illustrons la manière dont l'architecture complète de génération augmentée par recherche (Retrieval-Augmented Generation, RAG) peut être affinée de manière end-to-end. Nous mettons en évidence les principaux défis ingénierie qui ont dû être relevés pour atteindre cet objectif. Nous comparons également les performances de l'architecture RAG end-to-end avec celles de l'architecture RAG originale sur la tâche de réponse aux questions. Nous avons rendu notre implémentation disponible en open source dans la bibliothèque HuggingFace Transformers.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp