HyperAI

Visual Question Answering

Benchmark-Liste

Alle Benchmarks für diese Aufgabe

clevr
Bestes Modell: NS-VQA (1K programs)

Metriken

Details anzeigen
clevr-humans
Bestes Modell: MDETR

Metriken

Details anzeigen
coco-visual-question-answering-vqa-real-2
Bestes Modell: HDU-USYD-UNCC

Metriken

Details anzeigen
coco-visual-question-answering-vqa-real
Bestes Modell: MCB 7 att.

Metriken

Details anzeigen
docvqa-test
Bestes Modell: Human

Metriken

Details anzeigen
docvqa-val
Bestes Modell: BERT LARGE Baseline

Metriken

Details anzeigen
f-vqa
Bestes Modell: ZS-F-VQA

Metriken

Details anzeigen
figureqa-test-1
Bestes Modell: PReFIL

Metriken

Details anzeigen
gqa
Bestes Modell: PEVL+

Metriken

Details anzeigen
gqa-test-dev
Bestes Modell: CFR

Metriken

Details anzeigen
gqa-test-std
Bestes Modell: ProTo

Metriken

Details anzeigen
iconqa
Bestes Modell: Patch-TRM

Metriken

Details anzeigen
msrvtt-qa
Bestes Modell: mPLUG-2

Metriken

Details anzeigen
msvd-qa
Bestes Modell: mPLUG-2

Metriken

Details anzeigen
ok-vqa
Bestes Modell: PaLI-X (Single-task FT)

Metriken

Details anzeigen
qlevr
Bestes Modell: MAC

Metriken

Details anzeigen
tdiuc
Bestes Modell: Accuracy

Metriken

Details anzeigen
textvqa-test-standard
Bestes Modell: PaLI

Metriken

Details anzeigen
vcr-q-a-dev
Bestes Modell: VL-BERTLARGE

Metriken

Details anzeigen
vcr-q-ar-dev
Bestes Modell: VL-BERTLARGE

Metriken

Details anzeigen
vcr-q-ar-test
Bestes Modell: GPT4RoI

Metriken

Details anzeigen
vcr-qa-r-dev
Bestes Modell: VL-BERTLARGE

Metriken

Details anzeigen
vcr-qa-r-test
Bestes Modell: UNITER (Large)

Metriken

Details anzeigen
visual-genome-pairs
Bestes Modell: CMN

Metriken

Details anzeigen
visual7w
Bestes Modell: CMN

Metriken

Details anzeigen
vizwiz-2018
Bestes Modell: LXR955, No Ensemble

Metriken

Details anzeigen
vqa-ce
Bestes Modell: RandImg

Metriken

Details anzeigen
vqa-cp
Bestes Modell: CSS

Metriken

Details anzeigen
vqa-v1-test-dev
Bestes Modell: SAAA (ResNet)

Metriken

Details anzeigen
vqa-v1-test-std
Bestes Modell: SAAA (ResNet)

Metriken

Details anzeigen
vqa-v2-test-dev
Bestes Modell: Oscar

Metriken

Details anzeigen
vqa-v2-test-std
Bestes Modell: BEiT-3

Metriken

Details anzeigen
vqa-v2-val
Bestes Modell: BLIP-2 ViT-G FlanT5 XXL (zero-shot)

Metriken

Details anzeigen
zs-f-vqa
Bestes Modell: SAN † - hard mask

Metriken

Details anzeigen
infographicvqa
Bestes Modell: Gemini Ultra (pixel only)

Metriken

Details anzeigen
hallusionbench
Bestes Modell: GPT-4V

Metriken

Details anzeigen
autohallusion
Bestes Modell: GPT-4V

Metriken

Details anzeigen
activitynet
Bestes Modell: BLIP-2 T5

Metriken

Details anzeigen
artquest
Bestes Modell: PrefixLM with CLIP and T5

Metriken

Details anzeigen
core-mm
Bestes Modell: GPT-4V

Metriken

Details anzeigen
dvqa-test-familiar
Bestes Modell: PReFIL (Oracle OCR)

Metriken

Details anzeigen
egoschema
Bestes Modell: Lyra-Pro

Metriken

Details anzeigen
retvqa
Bestes Modell: MI-BART

Metriken

Details anzeigen
a-okvqa

Metriken

Details anzeigen
coco-visual-question-answering-vqa-abstract

Metriken

Details anzeigen
coco-visual-question-answering-vqa-abstract-1

Metriken

Details anzeigen
coco-visual-question-answering-vqa-real-1

Metriken

Details anzeigen
gqa-test2019

Metriken

Details anzeigen
grit

Metriken

Details anzeigen
plotqa-d1

Metriken

Details anzeigen
plotqa-d2

Metriken

Details anzeigen
tgif-qa

Metriken

Details anzeigen
vcr-q-a-test

Metriken

Details anzeigen
visual-genome-subjects

Metriken

Details anzeigen
vizwiz-2018-answerability

Metriken

Details anzeigen
vizwiz-2020-answerability

Metriken

Details anzeigen
vizwiz-2020-vqa

Metriken

Details anzeigen
vqa-x

Metriken

Details anzeigen
ai2d

Metriken

Details anzeigen
coco-4

Metriken

Details anzeigen
core-mm-1

Metriken

Details anzeigen
deepform

Metriken

Details anzeigen
docvqa

Metriken

Details anzeigen
illusionvqa

Metriken

Details anzeigen
imagenet

Metriken

Details anzeigen
infoseek

Metriken

Details anzeigen
mm-vet

Metriken

Details anzeigen
mme

Metriken

Details anzeigen
mvbench

Metriken

Details anzeigen
ovad-benchmark

Metriken

Details anzeigen
pmc-vqa

Metriken

Details anzeigen
textvqa

Metriken

Details anzeigen
video-mme-1

Metriken

Details anzeigen
vlm2-bench

Metriken

Details anzeigen
websrc

Metriken

Details anzeigen
whoops

Metriken

Details anzeigen