Visual Question Answering 1
قائمة المعايير القياسية
جميع المعايير القياسية المتعلقة بهذه المهمة
amber
أفضل نموذج: RLAIF-V 12B
المقاييس
عرض التفاصيل
benchlmm
أفضل نموذج: GPT-4V
المقاييس
عرض التفاصيل
clevr
أفضل نموذج: NeSyCoCo Neuro-Symbolic
المقاييس
عرض التفاصيل
earthvqa
أفضل نموذج: SOBA
المقاييس
عرض التفاصيل
grit
أفضل نموذج: OFA
المقاييس
عرض التفاصيل
mm-vet
أفضل نموذج: Gemini 1.5 Pro (gemini-1.5-pro-002)
المقاييس
عرض التفاصيل
mm-vet-w-o-external-tools
أفضل نموذج: Emu-14B
المقاييس
عرض التفاصيل
mmbench
أفضل نموذج: LLaVA-InternLM2-ViT + MoSLoRA
المقاييس
عرض التفاصيل
msrvtt-qa
أفضل نموذج: Aurora (ours, r=64) Aurora (ours, r=64)
المقاييس
عرض التفاصيل
textvqa-test-standard
أفضل نموذج: PromptCap
المقاييس
عرض التفاصيل
v-bench
أفضل نموذج: IVM-Enhanced GPT4-V
المقاييس
عرض التفاصيل
vip-bench
أفضل نموذج: GPT-4V-turbo-detail:high (Visual Prompt)
المقاييس
عرض التفاصيل
visualmrc
أفضل نموذج: LayoutT5 (Large)
المقاييس
عرض التفاصيل
vizwiz
أفضل نموذج: Emu-I *
المقاييس
عرض التفاصيل
vqa-v2
أفضل نموذج: RLHF-V
المقاييس
عرض التفاصيل
vqa-v2-test-dev
أفضل نموذج: BLIP-2 ViT-G OPT 6.7B (fine-tuned)
المقاييس
عرض التفاصيل
vqa-v2-test-std
أفضل نموذج: LXMERT (low-magnitude pruning)
المقاييس
عرض التفاصيل
coco
المقاييس
عرض التفاصيل
coco-visual-question-answering-vqa-real-2
المقاييس
عرض التفاصيل
gqa
المقاييس
عرض التفاصيل
mapeval-visual
المقاييس
عرض التفاصيل
mm-vet-v2
المقاييس
عرض التفاصيل
mmhal-bench
المقاييس
عرض التفاصيل
msvd-qa
المقاييس
عرض التفاصيل
plotqa-d1
المقاييس
عرض التفاصيل
plotqa-d2
المقاييس
عرض التفاصيل
vqa-v2-val
المقاييس
عرض التفاصيل