Visual Question Answering
قائمة المعايير القياسية
جميع المعايير القياسية المتعلقة بهذه المهمة
clevr
أفضل نموذج: NS-VQA (1K programs)
المقاييس
عرض التفاصيل
clevr-humans
أفضل نموذج: MDETR
المقاييس
عرض التفاصيل
coco-visual-question-answering-vqa-real-2
أفضل نموذج: HDU-USYD-UNCC
المقاييس
عرض التفاصيل
coco-visual-question-answering-vqa-real
أفضل نموذج: MCB 7 att.
المقاييس
عرض التفاصيل
docvqa-test
أفضل نموذج: Human
المقاييس
عرض التفاصيل
docvqa-val
أفضل نموذج: BERT LARGE Baseline
المقاييس
عرض التفاصيل
f-vqa
أفضل نموذج: ZS-F-VQA
المقاييس
عرض التفاصيل
figureqa-test-1
أفضل نموذج: PReFIL
المقاييس
عرض التفاصيل
gqa
أفضل نموذج: PEVL+
المقاييس
عرض التفاصيل
gqa-test-dev
أفضل نموذج: CFR
المقاييس
عرض التفاصيل
gqa-test-std
أفضل نموذج: ProTo
المقاييس
عرض التفاصيل
iconqa
أفضل نموذج: Patch-TRM
المقاييس
عرض التفاصيل
msrvtt-qa
أفضل نموذج: mPLUG-2
المقاييس
عرض التفاصيل
msvd-qa
أفضل نموذج: mPLUG-2
المقاييس
عرض التفاصيل
ok-vqa
أفضل نموذج: PaLI-X (Single-task FT)
المقاييس
عرض التفاصيل
qlevr
أفضل نموذج: MAC
المقاييس
عرض التفاصيل
tdiuc
أفضل نموذج: Accuracy
المقاييس
عرض التفاصيل
textvqa-test-standard
أفضل نموذج: PaLI
المقاييس
عرض التفاصيل
vcr-q-a-dev
أفضل نموذج: VL-BERTLARGE
المقاييس
عرض التفاصيل
vcr-q-ar-dev
أفضل نموذج: VL-BERTLARGE
المقاييس
عرض التفاصيل
vcr-q-ar-test
أفضل نموذج: GPT4RoI
المقاييس
عرض التفاصيل
vcr-qa-r-dev
أفضل نموذج: VL-BERTLARGE
المقاييس
عرض التفاصيل
vcr-qa-r-test
أفضل نموذج: UNITER (Large)
المقاييس
عرض التفاصيل
visual-genome-pairs
أفضل نموذج: CMN
المقاييس
عرض التفاصيل
visual7w
أفضل نموذج: CMN
المقاييس
عرض التفاصيل
vizwiz-2018
أفضل نموذج: LXR955, No Ensemble
المقاييس
عرض التفاصيل
vqa-ce
أفضل نموذج: RandImg
المقاييس
عرض التفاصيل
vqa-cp
أفضل نموذج: CSS
المقاييس
عرض التفاصيل
vqa-v1-test-dev
أفضل نموذج: SAAA (ResNet)
المقاييس
عرض التفاصيل
vqa-v1-test-std
أفضل نموذج: SAAA (ResNet)
المقاييس
عرض التفاصيل
vqa-v2-test-dev
أفضل نموذج: Oscar
المقاييس
عرض التفاصيل
vqa-v2-test-std
أفضل نموذج: BEiT-3
المقاييس
عرض التفاصيل
vqa-v2-val
أفضل نموذج: BLIP-2 ViT-G FlanT5 XXL (zero-shot)
المقاييس
عرض التفاصيل
zs-f-vqa
أفضل نموذج: SAN † - hard mask
المقاييس
عرض التفاصيل
infographicvqa
أفضل نموذج: Gemini Ultra (pixel only)
المقاييس
عرض التفاصيل
hallusionbench
أفضل نموذج: GPT-4V
المقاييس
عرض التفاصيل
autohallusion
أفضل نموذج: GPT-4V
المقاييس
عرض التفاصيل
activitynet
أفضل نموذج: BLIP-2 T5
المقاييس
عرض التفاصيل
artquest
أفضل نموذج: PrefixLM with CLIP and T5
المقاييس
عرض التفاصيل
core-mm
أفضل نموذج: GPT-4V
المقاييس
عرض التفاصيل
dvqa-test-familiar
أفضل نموذج: PReFIL (Oracle OCR)
المقاييس
عرض التفاصيل
egoschema
أفضل نموذج: Lyra-Pro
المقاييس
عرض التفاصيل
retvqa
أفضل نموذج: MI-BART
المقاييس
عرض التفاصيل
a-okvqa
المقاييس
عرض التفاصيل
coco-visual-question-answering-vqa-abstract
المقاييس
عرض التفاصيل
coco-visual-question-answering-vqa-abstract-1
المقاييس
عرض التفاصيل
coco-visual-question-answering-vqa-real-1
المقاييس
عرض التفاصيل
gqa-test2019
المقاييس
عرض التفاصيل
grit
المقاييس
عرض التفاصيل
plotqa-d1
المقاييس
عرض التفاصيل
plotqa-d2
المقاييس
عرض التفاصيل
tgif-qa
المقاييس
عرض التفاصيل
vcr-q-a-test
المقاييس
عرض التفاصيل
visual-genome-subjects
المقاييس
عرض التفاصيل
vizwiz-2018-answerability
المقاييس
عرض التفاصيل
vizwiz-2020-answerability
المقاييس
عرض التفاصيل
vizwiz-2020-vqa
المقاييس
عرض التفاصيل
vqa-x
المقاييس
عرض التفاصيل
ai2d
المقاييس
عرض التفاصيل
coco-4
المقاييس
عرض التفاصيل
core-mm-1
المقاييس
عرض التفاصيل
deepform
المقاييس
عرض التفاصيل
docvqa
المقاييس
عرض التفاصيل
illusionvqa
المقاييس
عرض التفاصيل
imagenet
المقاييس
عرض التفاصيل
infoseek
المقاييس
عرض التفاصيل
mm-vet
المقاييس
عرض التفاصيل
mme
المقاييس
عرض التفاصيل
mvbench
المقاييس
عرض التفاصيل
ovad-benchmark
المقاييس
عرض التفاصيل
pmc-vqa
المقاييس
عرض التفاصيل
textvqa
المقاييس
عرض التفاصيل
video-mme-1
المقاييس
عرض التفاصيل
vlm2-bench
المقاييس
عرض التفاصيل
websrc
المقاييس
عرض التفاصيل
whoops
المقاييس
عرض التفاصيل