HyperAI超神经

Visual Question Answering

基准测试列表

该任务相关的所有基准测试列表

clevr
最佳模型: NS-VQA (1K programs)

评估指标

查看详情
clevr-humans
最佳模型: MDETR

评估指标

查看详情
coco-visual-question-answering-vqa-real-2
最佳模型: HDU-USYD-UNCC

评估指标

查看详情
coco-visual-question-answering-vqa-real
最佳模型: MCB 7 att.

评估指标

查看详情
docvqa-test
最佳模型: Human

评估指标

查看详情
docvqa-val
最佳模型: BERT LARGE Baseline

评估指标

查看详情
f-vqa
最佳模型: ZS-F-VQA

评估指标

查看详情
figureqa-test-1
最佳模型: PReFIL

评估指标

查看详情
gqa
最佳模型: PEVL+

评估指标

查看详情
gqa-test-dev
最佳模型: CFR

评估指标

查看详情
gqa-test-std
最佳模型: ProTo

评估指标

查看详情
iconqa
最佳模型: Patch-TRM

评估指标

查看详情
msrvtt-qa
最佳模型: mPLUG-2

评估指标

查看详情
msvd-qa
最佳模型: mPLUG-2

评估指标

查看详情
ok-vqa
最佳模型: PaLI-X (Single-task FT)

评估指标

查看详情
qlevr
最佳模型: MAC

评估指标

查看详情
tdiuc
最佳模型: Accuracy

评估指标

查看详情
textvqa-test-standard
最佳模型: PaLI

评估指标

查看详情
vcr-q-a-dev
最佳模型: VL-BERTLARGE

评估指标

查看详情
vcr-q-ar-dev
最佳模型: VL-BERTLARGE

评估指标

查看详情
vcr-q-ar-test
最佳模型: GPT4RoI

评估指标

查看详情
vcr-qa-r-dev
最佳模型: VL-BERTLARGE

评估指标

查看详情
vcr-qa-r-test
最佳模型: UNITER (Large)

评估指标

查看详情
visual-genome-pairs
最佳模型: CMN

评估指标

查看详情
visual7w
最佳模型: CMN

评估指标

查看详情
vizwiz-2018
最佳模型: LXR955, No Ensemble

评估指标

查看详情
vqa-ce
最佳模型: RandImg

评估指标

查看详情
vqa-cp
最佳模型: CSS

评估指标

查看详情
vqa-v1-test-dev
最佳模型: SAAA (ResNet)

评估指标

查看详情
vqa-v1-test-std
最佳模型: SAAA (ResNet)

评估指标

查看详情
vqa-v2-test-dev
最佳模型: Oscar

评估指标

查看详情
vqa-v2-test-std
最佳模型: BEiT-3

评估指标

查看详情
vqa-v2-val
最佳模型: BLIP-2 ViT-G FlanT5 XXL (zero-shot)

评估指标

查看详情
zs-f-vqa
最佳模型: SAN † - hard mask

评估指标

查看详情
infographicvqa
最佳模型: Gemini Ultra (pixel only)

评估指标

查看详情
hallusionbench
最佳模型: GPT-4V

评估指标

查看详情
autohallusion
最佳模型: GPT-4V

评估指标

查看详情
activitynet
最佳模型: BLIP-2 T5

评估指标

查看详情
artquest
最佳模型: PrefixLM with CLIP and T5

评估指标

查看详情
core-mm
最佳模型: GPT-4V

评估指标

查看详情
dvqa-test-familiar
最佳模型: PReFIL (Oracle OCR)

评估指标

查看详情
egoschema
最佳模型: Lyra-Pro

评估指标

查看详情
retvqa
最佳模型: MI-BART

评估指标

查看详情
a-okvqa

评估指标

查看详情
coco-visual-question-answering-vqa-abstract

评估指标

查看详情
coco-visual-question-answering-vqa-abstract-1

评估指标

查看详情
coco-visual-question-answering-vqa-real-1

评估指标

查看详情
gqa-test2019

评估指标

查看详情
grit

评估指标

查看详情
plotqa-d1

评估指标

查看详情
plotqa-d2

评估指标

查看详情
tgif-qa

评估指标

查看详情
vcr-q-a-test

评估指标

查看详情
visual-genome-subjects

评估指标

查看详情
vizwiz-2018-answerability

评估指标

查看详情
vizwiz-2020-answerability

评估指标

查看详情
vizwiz-2020-vqa

评估指标

查看详情
vqa-x

评估指标

查看详情
ai2d

评估指标

查看详情
coco-4

评估指标

查看详情
core-mm-1

评估指标

查看详情
deepform

评估指标

查看详情
docvqa

评估指标

查看详情
illusionvqa

评估指标

查看详情
imagenet

评估指标

查看详情
infoseek

评估指标

查看详情
mm-vet

评估指标

查看详情
mme

评估指标

查看详情
mvbench

评估指标

查看详情
ovad-benchmark

评估指标

查看详情
pmc-vqa

评估指标

查看详情
textvqa

评估指标

查看详情
video-mme-1

评估指标

查看详情
vlm2-bench

评估指标

查看详情
websrc

评估指标

查看详情
whoops

评估指标

查看详情