HyperAIHyperAI

Command Palette

Search for a command to run...

ChartQA : Un benchmark pour les questions-réponses sur les graphiques avec raisonnement visuel et logique

Ahmed Masry* Do Xuan Long* Jia Qing Tan* Shafiq Joty** Enamul Hoque*

Résumé

Les graphiques sont très populaires pour l'analyse des données. Lorsqu'ils explorent ces graphiques, les gens posent souvent une variété de questions complexes impliquant plusieurs opérations logiques et arithmétiques. Ils font également fréquemment référence aux caractéristiques visuelles d'un graphique dans leurs questions. Cependant, la plupart des jeux de données existants ne se concentrent pas sur de telles questions complexes, car leurs questions sont basées sur des modèles et les réponses proviennent d'un vocabulaire fixe. Dans cette étude, nous présentons un benchmark à grande échelle couvrant 9 600 questions écrites par des humains ainsi que 23 100 questions générées à partir de résumés de graphiques écrits par des humains. Pour relever les défis uniques de notre benchmark, qui impliquent le raisonnement visuel et logique sur les graphiques, nous proposons deux modèles basés sur des transformers qui combinent les caractéristiques visuelles et le tableau de données du graphique de manière unifiée afin de répondre aux questions. Bien que nos modèles obtiennent des résultats à l'état de l'art sur les jeux de données précédents ainsi que sur notre benchmark, l'évaluation met également en lumière plusieurs défis dans la réponse aux questions complexes nécessitant du raisonnement.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp