HyperAI

Principal

GPU

Console
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
SOTA
Visual Question Answering (VQA) - Questionnement Visuel Automatisé

Visual Question Answering (VQA) - Questionnement Visuel Automatisé

Le Visual Question Answering (VQA) est une tâche dans le domaine de la vision par ordinateur qui vise à répondre aux questions sur les images en utilisant un langage naturel. L'objectif principal de cette tâche est de permettre aux machines de comprendre le contenu des images et de fournir des réponses précises et cohérentes sous forme linguistique. Le VQA a une valeur d'application importante dans l'interaction homme-machine, l'assistance intelligente et la compréhension du contenu, améliorant considérablement les capacités cognitives visuelles des machines.

VQA v2 test-dev

VQA v2 test-std

Gemini Ultra (pixel only)

VizWiz 2020 VQA

NS-VQA (1K programs)

COCO Visual Question Answering (VQA) real images 1.0 open ended

TextVQA test-standard

BLIP-2 ViT-G FlanT5 XXL (zero-shot)

COCO Visual Question Answering (VQA) real images 1.0 multiple choice

LXR955, No Ensemble

VCR (QA-R) test

VQA v1 test-dev

VCR (Q-AR) test

VizWiz 2020 Answerability

VQA v1 test-std

COCO Visual Question Answering (VQA) abstract images 1.0 open ended

COCO Visual Question Answering (VQA) real images 2.0 open ended

COCO Visual Question Answering (VQA) abstract 1.0 multiple choice

FigureQA - test 1

BERT LARGE Baseline

VizWiz 2018 Answerability

SAN † - hard mask

PrefixLM with CLIP and T5

DVQA test-familiar

PReFIL (Oracle OCR)

Visual Genome (subjects)

Visual Genome (pairs)

Construire l’avenir de l’intelligence artificielle

À propos

À propos Aide relative au jeu de données

Produits

Actualités Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Principal

GPU

Console
Docs
Tarifs

Pulse

Actualités

Ressources

Publications de recherche
Notebooks
Jeux de données
Wiki

Benchmarks

SOTA
Modèles LLM
Classement des GPU

Communauté

Événements

Utilitaires

À propos Conditions d’utilisation Politique de confidentialité
Français

Command Palette

Search for a command to run...

HyperAI
SOTA
Visual Question Answering (VQA) - Questionnement Visuel Automatisé

Visual Question Answering (VQA) - Questionnement Visuel Automatisé

Le Visual Question Answering (VQA) est une tâche dans le domaine de la vision par ordinateur qui vise à répondre aux questions sur les images en utilisant un langage naturel. L'objectif principal de cette tâche est de permettre aux machines de comprendre le contenu des images et de fournir des réponses précises et cohérentes sous forme linguistique. Le VQA a une valeur d'application importante dans l'interaction homme-machine, l'assistance intelligente et la compréhension du contenu, améliorant considérablement les capacités cognitives visuelles des machines.

VQA v2 test-dev

VQA v2 test-std

Gemini Ultra (pixel only)

VizWiz 2020 VQA

NS-VQA (1K programs)

COCO Visual Question Answering (VQA) real images 1.0 open ended

TextVQA test-standard

BLIP-2 ViT-G FlanT5 XXL (zero-shot)

COCO Visual Question Answering (VQA) real images 1.0 multiple choice

LXR955, No Ensemble

VCR (QA-R) test

VQA v1 test-dev

VCR (Q-AR) test

VizWiz 2020 Answerability

VQA v1 test-std

COCO Visual Question Answering (VQA) abstract images 1.0 open ended

COCO Visual Question Answering (VQA) real images 2.0 open ended

COCO Visual Question Answering (VQA) abstract 1.0 multiple choice

FigureQA - test 1

BERT LARGE Baseline

VizWiz 2018 Answerability

SAN † - hard mask

PrefixLM with CLIP and T5

DVQA test-familiar

PReFIL (Oracle OCR)

Visual Genome (subjects)

Visual Genome (pairs)

Construire l’avenir de l’intelligence artificielle

À propos

À propos Aide relative au jeu de données

Produits

Actualités Notebooks Jeux de données Wiki

Liens

© HyperAI

GitHub Discord X (formerly Twitter)