HyperAI초신경

Visual Question Answering

벤치마크 목록

해당 작업에 관련된 모든 벤치마크 목록

clevr
최고 모델: NS-VQA (1K programs)

평가 지표

세부 정보 보기
clevr-humans
최고 모델: MDETR

평가 지표

세부 정보 보기
coco-visual-question-answering-vqa-real-2
최고 모델: HDU-USYD-UNCC

평가 지표

세부 정보 보기
coco-visual-question-answering-vqa-real
최고 모델: MCB 7 att.

평가 지표

세부 정보 보기
docvqa-test
최고 모델: Human

평가 지표

세부 정보 보기
docvqa-val
최고 모델: BERT LARGE Baseline

평가 지표

세부 정보 보기
f-vqa
최고 모델: ZS-F-VQA

평가 지표

세부 정보 보기
figureqa-test-1
최고 모델: PReFIL

평가 지표

세부 정보 보기
gqa
최고 모델: PEVL+

평가 지표

세부 정보 보기
gqa-test-dev
최고 모델: CFR

평가 지표

세부 정보 보기
gqa-test-std
최고 모델: ProTo

평가 지표

세부 정보 보기
iconqa
최고 모델: Patch-TRM

평가 지표

세부 정보 보기
msrvtt-qa
최고 모델: mPLUG-2

평가 지표

세부 정보 보기
msvd-qa
최고 모델: mPLUG-2

평가 지표

세부 정보 보기
ok-vqa
최고 모델: PaLI-X (Single-task FT)

평가 지표

세부 정보 보기
qlevr
최고 모델: MAC

평가 지표

세부 정보 보기
tdiuc
최고 모델: Accuracy

평가 지표

세부 정보 보기
textvqa-test-standard
최고 모델: PaLI

평가 지표

세부 정보 보기
vcr-q-a-dev
최고 모델: VL-BERTLARGE

평가 지표

세부 정보 보기
vcr-q-ar-dev
최고 모델: VL-BERTLARGE

평가 지표

세부 정보 보기
vcr-q-ar-test
최고 모델: GPT4RoI

평가 지표

세부 정보 보기
vcr-qa-r-dev
최고 모델: VL-BERTLARGE

평가 지표

세부 정보 보기
vcr-qa-r-test
최고 모델: UNITER (Large)

평가 지표

세부 정보 보기
visual-genome-pairs
최고 모델: CMN

평가 지표

세부 정보 보기
visual7w
최고 모델: CMN

평가 지표

세부 정보 보기
vizwiz-2018
최고 모델: LXR955, No Ensemble

평가 지표

세부 정보 보기
vqa-ce
최고 모델: RandImg

평가 지표

세부 정보 보기
vqa-cp
최고 모델: CSS

평가 지표

세부 정보 보기
vqa-v1-test-dev
최고 모델: SAAA (ResNet)

평가 지표

세부 정보 보기
vqa-v1-test-std
최고 모델: SAAA (ResNet)

평가 지표

세부 정보 보기
vqa-v2-test-dev
최고 모델: Oscar

평가 지표

세부 정보 보기
vqa-v2-test-std
최고 모델: BEiT-3

평가 지표

세부 정보 보기
vqa-v2-val
최고 모델: BLIP-2 ViT-G FlanT5 XXL (zero-shot)

평가 지표

세부 정보 보기
zs-f-vqa
최고 모델: SAN † - hard mask

평가 지표

세부 정보 보기
infographicvqa
최고 모델: Gemini Ultra (pixel only)

평가 지표

세부 정보 보기
hallusionbench
최고 모델: GPT-4V

평가 지표

세부 정보 보기
autohallusion
최고 모델: GPT-4V

평가 지표

세부 정보 보기
activitynet
최고 모델: BLIP-2 T5

평가 지표

세부 정보 보기
artquest
최고 모델: PrefixLM with CLIP and T5

평가 지표

세부 정보 보기
core-mm
최고 모델: GPT-4V

평가 지표

세부 정보 보기
dvqa-test-familiar
최고 모델: PReFIL (Oracle OCR)

평가 지표

세부 정보 보기
egoschema
최고 모델: Lyra-Pro

평가 지표

세부 정보 보기
retvqa
최고 모델: MI-BART

평가 지표

세부 정보 보기
a-okvqa

평가 지표

세부 정보 보기
coco-visual-question-answering-vqa-abstract

평가 지표

세부 정보 보기
coco-visual-question-answering-vqa-abstract-1

평가 지표

세부 정보 보기
coco-visual-question-answering-vqa-real-1

평가 지표

세부 정보 보기
gqa-test2019

평가 지표

세부 정보 보기
grit

평가 지표

세부 정보 보기
plotqa-d1

평가 지표

세부 정보 보기
plotqa-d2

평가 지표

세부 정보 보기
tgif-qa

평가 지표

세부 정보 보기
vcr-q-a-test

평가 지표

세부 정보 보기
visual-genome-subjects

평가 지표

세부 정보 보기
vizwiz-2018-answerability

평가 지표

세부 정보 보기
vizwiz-2020-answerability

평가 지표

세부 정보 보기
vizwiz-2020-vqa

평가 지표

세부 정보 보기
vqa-x

평가 지표

세부 정보 보기
ai2d

평가 지표

세부 정보 보기
coco-4

평가 지표

세부 정보 보기
core-mm-1

평가 지표

세부 정보 보기
deepform

평가 지표

세부 정보 보기
docvqa

평가 지표

세부 정보 보기
illusionvqa

평가 지표

세부 정보 보기
imagenet

평가 지표

세부 정보 보기
infoseek

평가 지표

세부 정보 보기
mm-vet

평가 지표

세부 정보 보기
mme

평가 지표

세부 정보 보기
mvbench

평가 지표

세부 정보 보기
ovad-benchmark

평가 지표

세부 정보 보기
pmc-vqa

평가 지표

세부 정보 보기
textvqa

평가 지표

세부 정보 보기
video-mme-1

평가 지표

세부 정보 보기
vlm2-bench

평가 지표

세부 정보 보기
websrc

평가 지표

세부 정보 보기
whoops

평가 지표

세부 정보 보기