HyperAI

Visual Question Answering

قائمة المعايير القياسية

جميع المعايير القياسية المتعلقة بهذه المهمة

clevr
أفضل نموذج: NS-VQA (1K programs)

المقاييس

عرض التفاصيل
clevr-humans
أفضل نموذج: MDETR

المقاييس

عرض التفاصيل
coco-visual-question-answering-vqa-real-2
أفضل نموذج: HDU-USYD-UNCC

المقاييس

عرض التفاصيل
coco-visual-question-answering-vqa-real
أفضل نموذج: MCB 7 att.

المقاييس

عرض التفاصيل
docvqa-test
أفضل نموذج: Human

المقاييس

عرض التفاصيل
docvqa-val
أفضل نموذج: BERT LARGE Baseline

المقاييس

عرض التفاصيل
f-vqa
أفضل نموذج: ZS-F-VQA

المقاييس

عرض التفاصيل
figureqa-test-1
أفضل نموذج: PReFIL

المقاييس

عرض التفاصيل
gqa
أفضل نموذج: PEVL+

المقاييس

عرض التفاصيل
gqa-test-dev
أفضل نموذج: CFR

المقاييس

عرض التفاصيل
gqa-test-std
أفضل نموذج: ProTo

المقاييس

عرض التفاصيل
iconqa
أفضل نموذج: Patch-TRM

المقاييس

عرض التفاصيل
msrvtt-qa
أفضل نموذج: mPLUG-2

المقاييس

عرض التفاصيل
msvd-qa
أفضل نموذج: mPLUG-2

المقاييس

عرض التفاصيل
ok-vqa
أفضل نموذج: PaLI-X (Single-task FT)

المقاييس

عرض التفاصيل
qlevr
أفضل نموذج: MAC

المقاييس

عرض التفاصيل
tdiuc
أفضل نموذج: Accuracy

المقاييس

عرض التفاصيل
textvqa-test-standard
أفضل نموذج: PaLI

المقاييس

عرض التفاصيل
vcr-q-a-dev
أفضل نموذج: VL-BERTLARGE

المقاييس

عرض التفاصيل
vcr-q-ar-dev
أفضل نموذج: VL-BERTLARGE

المقاييس

عرض التفاصيل
vcr-q-ar-test
أفضل نموذج: GPT4RoI

المقاييس

عرض التفاصيل
vcr-qa-r-dev
أفضل نموذج: VL-BERTLARGE

المقاييس

عرض التفاصيل
vcr-qa-r-test
أفضل نموذج: UNITER (Large)

المقاييس

عرض التفاصيل
visual-genome-pairs
أفضل نموذج: CMN

المقاييس

عرض التفاصيل
visual7w
أفضل نموذج: CMN

المقاييس

عرض التفاصيل
vizwiz-2018
أفضل نموذج: LXR955, No Ensemble

المقاييس

عرض التفاصيل
vqa-ce
أفضل نموذج: RandImg

المقاييس

عرض التفاصيل
vqa-cp
أفضل نموذج: CSS

المقاييس

عرض التفاصيل
vqa-v1-test-dev
أفضل نموذج: SAAA (ResNet)

المقاييس

عرض التفاصيل
vqa-v1-test-std
أفضل نموذج: SAAA (ResNet)

المقاييس

عرض التفاصيل
vqa-v2-test-dev
أفضل نموذج: Oscar

المقاييس

عرض التفاصيل
vqa-v2-test-std
أفضل نموذج: BEiT-3

المقاييس

عرض التفاصيل
vqa-v2-val
أفضل نموذج: BLIP-2 ViT-G FlanT5 XXL (zero-shot)

المقاييس

عرض التفاصيل
zs-f-vqa
أفضل نموذج: SAN † - hard mask

المقاييس

عرض التفاصيل
infographicvqa
أفضل نموذج: Gemini Ultra (pixel only)

المقاييس

عرض التفاصيل
hallusionbench
أفضل نموذج: GPT-4V

المقاييس

عرض التفاصيل
autohallusion
أفضل نموذج: GPT-4V

المقاييس

عرض التفاصيل
activitynet
أفضل نموذج: BLIP-2 T5

المقاييس

عرض التفاصيل
artquest
أفضل نموذج: PrefixLM with CLIP and T5

المقاييس

عرض التفاصيل
core-mm
أفضل نموذج: GPT-4V

المقاييس

عرض التفاصيل
dvqa-test-familiar
أفضل نموذج: PReFIL (Oracle OCR)

المقاييس

عرض التفاصيل
egoschema
أفضل نموذج: Lyra-Pro

المقاييس

عرض التفاصيل
retvqa
أفضل نموذج: MI-BART

المقاييس

عرض التفاصيل
a-okvqa

المقاييس

عرض التفاصيل
coco-visual-question-answering-vqa-abstract

المقاييس

عرض التفاصيل
coco-visual-question-answering-vqa-abstract-1

المقاييس

عرض التفاصيل
coco-visual-question-answering-vqa-real-1

المقاييس

عرض التفاصيل
gqa-test2019

المقاييس

عرض التفاصيل
grit

المقاييس

عرض التفاصيل
plotqa-d1

المقاييس

عرض التفاصيل
plotqa-d2

المقاييس

عرض التفاصيل
tgif-qa

المقاييس

عرض التفاصيل
vcr-q-a-test

المقاييس

عرض التفاصيل
visual-genome-subjects

المقاييس

عرض التفاصيل
vizwiz-2018-answerability

المقاييس

عرض التفاصيل
vizwiz-2020-answerability

المقاييس

عرض التفاصيل
vizwiz-2020-vqa

المقاييس

عرض التفاصيل
vqa-x

المقاييس

عرض التفاصيل
ai2d

المقاييس

عرض التفاصيل
coco-4

المقاييس

عرض التفاصيل
core-mm-1

المقاييس

عرض التفاصيل
deepform

المقاييس

عرض التفاصيل
docvqa

المقاييس

عرض التفاصيل
illusionvqa

المقاييس

عرض التفاصيل
imagenet

المقاييس

عرض التفاصيل
infoseek

المقاييس

عرض التفاصيل
mm-vet

المقاييس

عرض التفاصيل
mme

المقاييس

عرض التفاصيل
mvbench

المقاييس

عرض التفاصيل
ovad-benchmark

المقاييس

عرض التفاصيل
pmc-vqa

المقاييس

عرض التفاصيل
textvqa

المقاييس

عرض التفاصيل
video-mme-1

المقاييس

عرض التفاصيل
vlm2-bench

المقاييس

عرض التفاصيل
websrc

المقاييس

عرض التفاصيل
whoops

المقاييس

عرض التفاصيل