HyperAI超神経

Visual Question Answering

ベンチマークリスト

このタスクに関連するすべてのベンチマーク

clevr
最高モデル: NS-VQA (1K programs)

評価指標

詳細を表示
clevr-humans
最高モデル: MDETR

評価指標

詳細を表示
coco-visual-question-answering-vqa-real-2
最高モデル: HDU-USYD-UNCC

評価指標

詳細を表示
coco-visual-question-answering-vqa-real
最高モデル: MCB 7 att.

評価指標

詳細を表示
docvqa-test
最高モデル: Human

評価指標

詳細を表示
docvqa-val
最高モデル: BERT LARGE Baseline

評価指標

詳細を表示
f-vqa
最高モデル: ZS-F-VQA

評価指標

詳細を表示
figureqa-test-1
最高モデル: PReFIL

評価指標

詳細を表示
gqa
最高モデル: PEVL+

評価指標

詳細を表示
gqa-test-dev
最高モデル: CFR

評価指標

詳細を表示
gqa-test-std
最高モデル: ProTo

評価指標

詳細を表示
iconqa
最高モデル: Patch-TRM

評価指標

詳細を表示
msrvtt-qa
最高モデル: mPLUG-2

評価指標

詳細を表示
msvd-qa
最高モデル: mPLUG-2

評価指標

詳細を表示
ok-vqa
最高モデル: PaLI-X (Single-task FT)

評価指標

詳細を表示
qlevr
最高モデル: MAC

評価指標

詳細を表示
tdiuc
最高モデル: Accuracy

評価指標

詳細を表示
textvqa-test-standard
最高モデル: PaLI

評価指標

詳細を表示
vcr-q-a-dev
最高モデル: VL-BERTLARGE

評価指標

詳細を表示
vcr-q-ar-dev
最高モデル: VL-BERTLARGE

評価指標

詳細を表示
vcr-q-ar-test
最高モデル: GPT4RoI

評価指標

詳細を表示
vcr-qa-r-dev
最高モデル: VL-BERTLARGE

評価指標

詳細を表示
vcr-qa-r-test
最高モデル: UNITER (Large)

評価指標

詳細を表示
visual-genome-pairs
最高モデル: CMN

評価指標

詳細を表示
visual7w
最高モデル: CMN

評価指標

詳細を表示
vizwiz-2018
最高モデル: LXR955, No Ensemble

評価指標

詳細を表示
vqa-ce
最高モデル: RandImg

評価指標

詳細を表示
vqa-cp
最高モデル: CSS

評価指標

詳細を表示
vqa-v1-test-dev
最高モデル: SAAA (ResNet)

評価指標

詳細を表示
vqa-v1-test-std
最高モデル: SAAA (ResNet)

評価指標

詳細を表示
vqa-v2-test-dev
最高モデル: Oscar

評価指標

詳細を表示
vqa-v2-test-std
最高モデル: BEiT-3

評価指標

詳細を表示
vqa-v2-val
最高モデル: BLIP-2 ViT-G FlanT5 XXL (zero-shot)

評価指標

詳細を表示
zs-f-vqa
最高モデル: SAN † - hard mask

評価指標

詳細を表示
infographicvqa
最高モデル: Gemini Ultra (pixel only)

評価指標

詳細を表示
hallusionbench
最高モデル: GPT-4V

評価指標

詳細を表示
autohallusion
最高モデル: GPT-4V

評価指標

詳細を表示
activitynet
最高モデル: BLIP-2 T5

評価指標

詳細を表示
artquest
最高モデル: PrefixLM with CLIP and T5

評価指標

詳細を表示
core-mm
最高モデル: GPT-4V

評価指標

詳細を表示
dvqa-test-familiar
最高モデル: PReFIL (Oracle OCR)

評価指標

詳細を表示
egoschema
最高モデル: Lyra-Pro

評価指標

詳細を表示
retvqa
最高モデル: MI-BART

評価指標

詳細を表示
a-okvqa

評価指標

詳細を表示
coco-visual-question-answering-vqa-abstract

評価指標

詳細を表示
coco-visual-question-answering-vqa-abstract-1

評価指標

詳細を表示
coco-visual-question-answering-vqa-real-1

評価指標

詳細を表示
gqa-test2019

評価指標

詳細を表示
grit

評価指標

詳細を表示
plotqa-d1

評価指標

詳細を表示
plotqa-d2

評価指標

詳細を表示
tgif-qa

評価指標

詳細を表示
vcr-q-a-test

評価指標

詳細を表示
visual-genome-subjects

評価指標

詳細を表示
vizwiz-2018-answerability

評価指標

詳細を表示
vizwiz-2020-answerability

評価指標

詳細を表示
vizwiz-2020-vqa

評価指標

詳細を表示
vqa-x

評価指標

詳細を表示
ai2d

評価指標

詳細を表示
coco-4

評価指標

詳細を表示
core-mm-1

評価指標

詳細を表示
deepform

評価指標

詳細を表示
docvqa

評価指標

詳細を表示
illusionvqa

評価指標

詳細を表示
imagenet

評価指標

詳細を表示
infoseek

評価指標

詳細を表示
mm-vet

評価指標

詳細を表示
mme

評価指標

詳細を表示
mvbench

評価指標

詳細を表示
ovad-benchmark

評価指標

詳細を表示
pmc-vqa

評価指標

詳細を表示
textvqa

評価指標

詳細を表示
video-mme-1

評価指標

詳細を表示
vlm2-bench

評価指標

詳細を表示
websrc

評価指標

詳細を表示
whoops

評価指標

詳細を表示