HyperAIHyperAI

Command Palette

Search for a command to run...

ChatQA : Dépasser GPT-4 en matière de questions-réponses conversationnelles et de récupération-assistance-génération (RAG)

Zihan Liu Wei Ping Rajarshi Roy Peng Xu Chankyu Lee Mohammad Shoeybi Bryan Catanzaro

Résumé

Dans cette étude, nous présentons ChatQA, une suite de modèles qui surpassent GPT-4 en génération augmentée par la recherche (RAG) et en réponse conversationnelle aux questions (QA). Pour améliorer la génération, nous proposons une méthode de réglage d'instructions en deux étapes qui augmente considérablement les performances de RAG. En ce qui concerne la recherche efficace, nous introduisons un récupérateur dense optimisé pour la QA conversationnelle, offrant des résultats comparables à ceux des modèles alternatifs de réécriture de requêtes de pointe tout en réduisant considérablement les coûts de déploiement. Nous présentons également le ChatRAG Bench, qui comprend dix jeux de données couvrant des évaluations exhaustives sur RAG, les questions liées aux tables, les calculs arithmétiques et les scénarios impliquant des questions non répondables. Notre modèle ChatQA-1.0-70B (note : 54,14), basé sur Llama2, un modèle fondamental moins performant que GPT-4, peut légèrement surpasser GPT-4-0613 (note : 53,90) et GPT-4-Turbo-2024-04-09 (note : 54,03) sur le ChatRAG Bench sans utiliser aucune donnée synthétique provenant des modèles GPT d'OpenAI. Notamment, le modèle Llama3-ChatQA-1.5-70B dépasse la précision de GPT-4-Turbo-2024-04-09 avec une amélioration de 4,4 %. Pour faire progresser la recherche dans ce domaine, nous avons rendu open source les poids du modèle, les données de réglage d'instructions, le ChatRAG Bench et le récupérateur pour la communauté : https://chatqa-project.github.io/.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp