HyperAI

Visual Question Answering 1

قائمة المعايير القياسية

جميع المعايير القياسية المتعلقة بهذه المهمة

amber
أفضل نموذج: RLAIF-V 12B

المقاييس

عرض التفاصيل
benchlmm
أفضل نموذج: GPT-4V

المقاييس

عرض التفاصيل
clevr
أفضل نموذج: NeSyCoCo Neuro-Symbolic

المقاييس

عرض التفاصيل
earthvqa
أفضل نموذج: SOBA

المقاييس

عرض التفاصيل
grit
أفضل نموذج: OFA

المقاييس

عرض التفاصيل
mm-vet
أفضل نموذج: Gemini 1.5 Pro (gemini-1.5-pro-002)

المقاييس

عرض التفاصيل
mm-vet-w-o-external-tools
أفضل نموذج: Emu-14B

المقاييس

عرض التفاصيل
mmbench
أفضل نموذج: LLaVA-InternLM2-ViT + MoSLoRA

المقاييس

عرض التفاصيل
msrvtt-qa
أفضل نموذج: Aurora (ours, r=64) Aurora (ours, r=64)

المقاييس

عرض التفاصيل
textvqa-test-standard
أفضل نموذج: PromptCap

المقاييس

عرض التفاصيل
v-bench
أفضل نموذج: IVM-Enhanced GPT4-V

المقاييس

عرض التفاصيل
vip-bench
أفضل نموذج: GPT-4V-turbo-detail:high (Visual Prompt)

المقاييس

عرض التفاصيل
visualmrc
أفضل نموذج: LayoutT5 (Large)

المقاييس

عرض التفاصيل
vizwiz
أفضل نموذج: Emu-I *

المقاييس

عرض التفاصيل
vqa-v2
أفضل نموذج: RLHF-V

المقاييس

عرض التفاصيل
vqa-v2-test-dev
أفضل نموذج: BLIP-2 ViT-G OPT 6.7B (fine-tuned)

المقاييس

عرض التفاصيل
vqa-v2-test-std
أفضل نموذج: LXMERT (low-magnitude pruning)

المقاييس

عرض التفاصيل
coco

المقاييس

عرض التفاصيل
coco-visual-question-answering-vqa-real-2

المقاييس

عرض التفاصيل
gqa

المقاييس

عرض التفاصيل
mapeval-visual

المقاييس

عرض التفاصيل
mm-vet-v2

المقاييس

عرض التفاصيل
mmhal-bench

المقاييس

عرض التفاصيل
msvd-qa

المقاييس

عرض التفاصيل
plotqa-d1

المقاييس

عرض التفاصيل
plotqa-d2

المقاييس

عرض التفاصيل
vqa-v2-val

المقاييس

عرض التفاصيل