Visual Question Answering
基准测试列表
该任务相关的所有基准测试列表
clevr
最佳模型: NS-VQA (1K programs)
评估指标
查看详情
clevr-humans
最佳模型: MDETR
评估指标
查看详情
coco-visual-question-answering-vqa-real-2
最佳模型: HDU-USYD-UNCC
评估指标
查看详情
coco-visual-question-answering-vqa-real
最佳模型: MCB 7 att.
评估指标
查看详情
docvqa-test
最佳模型: Human
评估指标
查看详情
docvqa-val
最佳模型: BERT LARGE Baseline
评估指标
查看详情
f-vqa
最佳模型: ZS-F-VQA
评估指标
查看详情
figureqa-test-1
最佳模型: PReFIL
评估指标
查看详情
gqa
最佳模型: PEVL+
评估指标
查看详情
gqa-test-dev
最佳模型: CFR
评估指标
查看详情
gqa-test-std
最佳模型: ProTo
评估指标
查看详情
iconqa
最佳模型: Patch-TRM
评估指标
查看详情
msrvtt-qa
最佳模型: mPLUG-2
评估指标
查看详情
msvd-qa
最佳模型: mPLUG-2
评估指标
查看详情
ok-vqa
最佳模型: PaLI-X (Single-task FT)
评估指标
查看详情
qlevr
最佳模型: MAC
评估指标
查看详情
tdiuc
最佳模型: Accuracy
评估指标
查看详情
textvqa-test-standard
最佳模型: PaLI
评估指标
查看详情
vcr-q-a-dev
最佳模型: VL-BERTLARGE
评估指标
查看详情
vcr-q-ar-dev
最佳模型: VL-BERTLARGE
评估指标
查看详情
vcr-q-ar-test
最佳模型: GPT4RoI
评估指标
查看详情
vcr-qa-r-dev
最佳模型: VL-BERTLARGE
评估指标
查看详情
vcr-qa-r-test
最佳模型: UNITER (Large)
评估指标
查看详情
visual-genome-pairs
最佳模型: CMN
评估指标
查看详情
visual7w
最佳模型: CMN
评估指标
查看详情
vizwiz-2018
最佳模型: LXR955, No Ensemble
评估指标
查看详情
vqa-ce
最佳模型: RandImg
评估指标
查看详情
vqa-cp
最佳模型: CSS
评估指标
查看详情
vqa-v1-test-dev
最佳模型: SAAA (ResNet)
评估指标
查看详情
vqa-v1-test-std
最佳模型: SAAA (ResNet)
评估指标
查看详情
vqa-v2-test-dev
最佳模型: Oscar
评估指标
查看详情
vqa-v2-test-std
最佳模型: BEiT-3
评估指标
查看详情
vqa-v2-val
最佳模型: BLIP-2 ViT-G FlanT5 XXL (zero-shot)
评估指标
查看详情
zs-f-vqa
最佳模型: SAN † - hard mask
评估指标
查看详情
infographicvqa
最佳模型: Gemini Ultra (pixel only)
评估指标
查看详情
hallusionbench
最佳模型: GPT-4V
评估指标
查看详情
autohallusion
最佳模型: GPT-4V
评估指标
查看详情
activitynet
最佳模型: BLIP-2 T5
评估指标
查看详情
artquest
最佳模型: PrefixLM with CLIP and T5
评估指标
查看详情
core-mm
最佳模型: GPT-4V
评估指标
查看详情
dvqa-test-familiar
最佳模型: PReFIL (Oracle OCR)
评估指标
查看详情
egoschema
最佳模型: Lyra-Pro
评估指标
查看详情
retvqa
最佳模型: MI-BART
评估指标
查看详情
a-okvqa
评估指标
查看详情
coco-visual-question-answering-vqa-abstract
评估指标
查看详情
coco-visual-question-answering-vqa-abstract-1
评估指标
查看详情
coco-visual-question-answering-vqa-real-1
评估指标
查看详情
gqa-test2019
评估指标
查看详情
grit
评估指标
查看详情
plotqa-d1
评估指标
查看详情
plotqa-d2
评估指标
查看详情
tgif-qa
评估指标
查看详情
vcr-q-a-test
评估指标
查看详情
visual-genome-subjects
评估指标
查看详情
vizwiz-2018-answerability
评估指标
查看详情
vizwiz-2020-answerability
评估指标
查看详情
vizwiz-2020-vqa
评估指标
查看详情
vqa-x
评估指标
查看详情
ai2d
评估指标
查看详情
coco-4
评估指标
查看详情
core-mm-1
评估指标
查看详情
deepform
评估指标
查看详情
docvqa
评估指标
查看详情
illusionvqa
评估指标
查看详情
imagenet
评估指标
查看详情
infoseek
评估指标
查看详情
mm-vet
评估指标
查看详情
mme
评估指标
查看详情
mvbench
评估指标
查看详情
ovad-benchmark
评估指标
查看详情
pmc-vqa
评估指标
查看详情
textvqa
评估指标
查看详情
video-mme-1
评估指标
查看详情
vlm2-bench
评估指标
查看详情
websrc
评估指标
查看详情
whoops
评估指标
查看详情