HyperAIHyperAI

Command Palette

Search for a command to run...

Classification-Régression pour la Compréhension des Graphiques

Matan Levy Rami Ben-Ari Dani Lischinski

Résumé

La tâche de réponse aux questions sur les graphiques (Chart Question Answering, CQA) est utilisée pour évaluer la compréhension des graphiques, ce qui est fondamentalement différent de la compréhension des images naturelles. Le CQA nécessite d'analyser les relations entre les composantes textuelles et visuelles d'un graphique afin de répondre à des questions générales ou d'inférer des valeurs numériques. La plupart des ensembles de données et modèles existants en CQA reposent sur des hypothèses simplificatrices qui permettent souvent de surpasser les performances humaines. Dans cette étude, nous abordons ce résultat et proposons un nouveau modèle qui apprend conjointement la classification et la régression. Notre configuration langage-vision utilise des transformateurs à co-attention pour capturer les interactions complexes du monde réel entre la question et les éléments textuels. Nous validons notre conception par des expérimentations approfondies sur l'ensemble de données PlotQA réaliste, surpassant largement les approches précédentes tout en montrant une performance compétitive sur FigureQA. Notre modèle est particulièrement adapté aux questions réalistes avec des réponses hors vocabulaire qui nécessitent une régression.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp