Visual Question Answering
Benchmark-Liste
Alle Benchmarks für diese Aufgabe
clevr
Bestes Modell: NS-VQA (1K programs)
Metriken
Details anzeigen
clevr-humans
Bestes Modell: MDETR
Metriken
Details anzeigen
coco-visual-question-answering-vqa-real-2
Bestes Modell: HDU-USYD-UNCC
Metriken
Details anzeigen
coco-visual-question-answering-vqa-real
Bestes Modell: MCB 7 att.
Metriken
Details anzeigen
docvqa-test
Bestes Modell: Human
Metriken
Details anzeigen
docvqa-val
Bestes Modell: BERT LARGE Baseline
Metriken
Details anzeigen
f-vqa
Bestes Modell: ZS-F-VQA
Metriken
Details anzeigen
figureqa-test-1
Bestes Modell: PReFIL
Metriken
Details anzeigen
gqa
Bestes Modell: PEVL+
Metriken
Details anzeigen
gqa-test-dev
Bestes Modell: CFR
Metriken
Details anzeigen
gqa-test-std
Bestes Modell: ProTo
Metriken
Details anzeigen
iconqa
Bestes Modell: Patch-TRM
Metriken
Details anzeigen
msrvtt-qa
Bestes Modell: mPLUG-2
Metriken
Details anzeigen
msvd-qa
Bestes Modell: mPLUG-2
Metriken
Details anzeigen
ok-vqa
Bestes Modell: PaLI-X (Single-task FT)
Metriken
Details anzeigen
qlevr
Bestes Modell: MAC
Metriken
Details anzeigen
tdiuc
Bestes Modell: Accuracy
Metriken
Details anzeigen
textvqa-test-standard
Bestes Modell: PaLI
Metriken
Details anzeigen
vcr-q-a-dev
Bestes Modell: VL-BERTLARGE
Metriken
Details anzeigen
vcr-q-ar-dev
Bestes Modell: VL-BERTLARGE
Metriken
Details anzeigen
vcr-q-ar-test
Bestes Modell: GPT4RoI
Metriken
Details anzeigen
vcr-qa-r-dev
Bestes Modell: VL-BERTLARGE
Metriken
Details anzeigen
vcr-qa-r-test
Bestes Modell: UNITER (Large)
Metriken
Details anzeigen
visual-genome-pairs
Bestes Modell: CMN
Metriken
Details anzeigen
visual7w
Bestes Modell: CMN
Metriken
Details anzeigen
vizwiz-2018
Bestes Modell: LXR955, No Ensemble
Metriken
Details anzeigen
vqa-ce
Bestes Modell: RandImg
Metriken
Details anzeigen
vqa-cp
Bestes Modell: CSS
Metriken
Details anzeigen
vqa-v1-test-dev
Bestes Modell: SAAA (ResNet)
Metriken
Details anzeigen
vqa-v1-test-std
Bestes Modell: SAAA (ResNet)
Metriken
Details anzeigen
vqa-v2-test-dev
Bestes Modell: Oscar
Metriken
Details anzeigen
vqa-v2-test-std
Bestes Modell: BEiT-3
Metriken
Details anzeigen
vqa-v2-val
Bestes Modell: BLIP-2 ViT-G FlanT5 XXL (zero-shot)
Metriken
Details anzeigen
zs-f-vqa
Bestes Modell: SAN † - hard mask
Metriken
Details anzeigen
infographicvqa
Bestes Modell: Gemini Ultra (pixel only)
Metriken
Details anzeigen
hallusionbench
Bestes Modell: GPT-4V
Metriken
Details anzeigen
autohallusion
Bestes Modell: GPT-4V
Metriken
Details anzeigen
activitynet
Bestes Modell: BLIP-2 T5
Metriken
Details anzeigen
artquest
Bestes Modell: PrefixLM with CLIP and T5
Metriken
Details anzeigen
core-mm
Bestes Modell: GPT-4V
Metriken
Details anzeigen
dvqa-test-familiar
Bestes Modell: PReFIL (Oracle OCR)
Metriken
Details anzeigen
egoschema
Bestes Modell: Lyra-Pro
Metriken
Details anzeigen
retvqa
Bestes Modell: MI-BART
Metriken
Details anzeigen
a-okvqa
Metriken
Details anzeigen
coco-visual-question-answering-vqa-abstract
Metriken
Details anzeigen
coco-visual-question-answering-vqa-abstract-1
Metriken
Details anzeigen
coco-visual-question-answering-vqa-real-1
Metriken
Details anzeigen
gqa-test2019
Metriken
Details anzeigen
grit
Metriken
Details anzeigen
plotqa-d1
Metriken
Details anzeigen
plotqa-d2
Metriken
Details anzeigen
tgif-qa
Metriken
Details anzeigen
vcr-q-a-test
Metriken
Details anzeigen
visual-genome-subjects
Metriken
Details anzeigen
vizwiz-2018-answerability
Metriken
Details anzeigen
vizwiz-2020-answerability
Metriken
Details anzeigen
vizwiz-2020-vqa
Metriken
Details anzeigen
vqa-x
Metriken
Details anzeigen
ai2d
Metriken
Details anzeigen
coco-4
Metriken
Details anzeigen
core-mm-1
Metriken
Details anzeigen
deepform
Metriken
Details anzeigen
docvqa
Metriken
Details anzeigen
illusionvqa
Metriken
Details anzeigen
imagenet
Metriken
Details anzeigen
infoseek
Metriken
Details anzeigen
mm-vet
Metriken
Details anzeigen
mme
Metriken
Details anzeigen
mvbench
Metriken
Details anzeigen
ovad-benchmark
Metriken
Details anzeigen
pmc-vqa
Metriken
Details anzeigen
textvqa
Metriken
Details anzeigen
video-mme-1
Metriken
Details anzeigen
vlm2-bench
Metriken
Details anzeigen
websrc
Metriken
Details anzeigen
whoops
Metriken
Details anzeigen