Visual Question Answering
ベンチマークリスト
このタスクに関連するすべてのベンチマーク
clevr
最高モデル: NS-VQA (1K programs)
評価指標
詳細を表示
clevr-humans
最高モデル: MDETR
評価指標
詳細を表示
coco-visual-question-answering-vqa-real-2
最高モデル: HDU-USYD-UNCC
評価指標
詳細を表示
coco-visual-question-answering-vqa-real
最高モデル: MCB 7 att.
評価指標
詳細を表示
docvqa-test
最高モデル: Human
評価指標
詳細を表示
docvqa-val
最高モデル: BERT LARGE Baseline
評価指標
詳細を表示
f-vqa
最高モデル: ZS-F-VQA
評価指標
詳細を表示
figureqa-test-1
最高モデル: PReFIL
評価指標
詳細を表示
gqa
最高モデル: PEVL+
評価指標
詳細を表示
gqa-test-dev
最高モデル: CFR
評価指標
詳細を表示
gqa-test-std
最高モデル: ProTo
評価指標
詳細を表示
iconqa
最高モデル: Patch-TRM
評価指標
詳細を表示
msrvtt-qa
最高モデル: mPLUG-2
評価指標
詳細を表示
msvd-qa
最高モデル: mPLUG-2
評価指標
詳細を表示
ok-vqa
最高モデル: PaLI-X (Single-task FT)
評価指標
詳細を表示
qlevr
最高モデル: MAC
評価指標
詳細を表示
tdiuc
最高モデル: Accuracy
評価指標
詳細を表示
textvqa-test-standard
最高モデル: PaLI
評価指標
詳細を表示
vcr-q-a-dev
最高モデル: VL-BERTLARGE
評価指標
詳細を表示
vcr-q-ar-dev
最高モデル: VL-BERTLARGE
評価指標
詳細を表示
vcr-q-ar-test
最高モデル: GPT4RoI
評価指標
詳細を表示
vcr-qa-r-dev
最高モデル: VL-BERTLARGE
評価指標
詳細を表示
vcr-qa-r-test
最高モデル: UNITER (Large)
評価指標
詳細を表示
visual-genome-pairs
最高モデル: CMN
評価指標
詳細を表示
visual7w
最高モデル: CMN
評価指標
詳細を表示
vizwiz-2018
最高モデル: LXR955, No Ensemble
評価指標
詳細を表示
vqa-ce
最高モデル: RandImg
評価指標
詳細を表示
vqa-cp
最高モデル: CSS
評価指標
詳細を表示
vqa-v1-test-dev
最高モデル: SAAA (ResNet)
評価指標
詳細を表示
vqa-v1-test-std
最高モデル: SAAA (ResNet)
評価指標
詳細を表示
vqa-v2-test-dev
最高モデル: Oscar
評価指標
詳細を表示
vqa-v2-test-std
最高モデル: BEiT-3
評価指標
詳細を表示
vqa-v2-val
最高モデル: BLIP-2 ViT-G FlanT5 XXL (zero-shot)
評価指標
詳細を表示
zs-f-vqa
最高モデル: SAN † - hard mask
評価指標
詳細を表示
infographicvqa
最高モデル: Gemini Ultra (pixel only)
評価指標
詳細を表示
hallusionbench
最高モデル: GPT-4V
評価指標
詳細を表示
autohallusion
最高モデル: GPT-4V
評価指標
詳細を表示
activitynet
最高モデル: BLIP-2 T5
評価指標
詳細を表示
artquest
最高モデル: PrefixLM with CLIP and T5
評価指標
詳細を表示
core-mm
最高モデル: GPT-4V
評価指標
詳細を表示
dvqa-test-familiar
最高モデル: PReFIL (Oracle OCR)
評価指標
詳細を表示
egoschema
最高モデル: Lyra-Pro
評価指標
詳細を表示
retvqa
最高モデル: MI-BART
評価指標
詳細を表示
a-okvqa
評価指標
詳細を表示
coco-visual-question-answering-vqa-abstract
評価指標
詳細を表示
coco-visual-question-answering-vqa-abstract-1
評価指標
詳細を表示
coco-visual-question-answering-vqa-real-1
評価指標
詳細を表示
gqa-test2019
評価指標
詳細を表示
grit
評価指標
詳細を表示
plotqa-d1
評価指標
詳細を表示
plotqa-d2
評価指標
詳細を表示
tgif-qa
評価指標
詳細を表示
vcr-q-a-test
評価指標
詳細を表示
visual-genome-subjects
評価指標
詳細を表示
vizwiz-2018-answerability
評価指標
詳細を表示
vizwiz-2020-answerability
評価指標
詳細を表示
vizwiz-2020-vqa
評価指標
詳細を表示
vqa-x
評価指標
詳細を表示
ai2d
評価指標
詳細を表示
coco-4
評価指標
詳細を表示
core-mm-1
評価指標
詳細を表示
deepform
評価指標
詳細を表示
docvqa
評価指標
詳細を表示
illusionvqa
評価指標
詳細を表示
imagenet
評価指標
詳細を表示
infoseek
評価指標
詳細を表示
mm-vet
評価指標
詳細を表示
mme
評価指標
詳細を表示
mvbench
評価指標
詳細を表示
ovad-benchmark
評価指標
詳細を表示
pmc-vqa
評価指標
詳細を表示
textvqa
評価指標
詳細を表示
video-mme-1
評価指標
詳細を表示
vlm2-bench
評価指標
詳細を表示
websrc
評価指標
詳細を表示
whoops
評価指標
詳細を表示