Visual Question Answering 1
基准测试列表
该任务相关的所有基准测试列表
amber
最佳模型: RLAIF-V 12B
评估指标
查看详情
benchlmm
最佳模型: GPT-4V
评估指标
查看详情
clevr
最佳模型: NeSyCoCo Neuro-Symbolic
评估指标
查看详情
earthvqa
最佳模型: SOBA
评估指标
查看详情
grit
最佳模型: OFA
评估指标
查看详情
mm-vet
最佳模型: Gemini 1.5 Pro (gemini-1.5-pro-002)
评估指标
查看详情
mm-vet-w-o-external-tools
最佳模型: Emu-14B
评估指标
查看详情
mmbench
最佳模型: LLaVA-InternLM2-ViT + MoSLoRA
评估指标
查看详情
msrvtt-qa
最佳模型: Aurora (ours, r=64) Aurora (ours, r=64)
评估指标
查看详情
textvqa-test-standard
最佳模型: PromptCap
评估指标
查看详情
v-bench
最佳模型: IVM-Enhanced GPT4-V
评估指标
查看详情
vip-bench
最佳模型: GPT-4V-turbo-detail:high (Visual Prompt)
评估指标
查看详情
visualmrc
最佳模型: LayoutT5 (Large)
评估指标
查看详情
vizwiz
最佳模型: Emu-I *
评估指标
查看详情
vqa-v2
最佳模型: RLHF-V
评估指标
查看详情
vqa-v2-test-dev
最佳模型: BLIP-2 ViT-G OPT 6.7B (fine-tuned)
评估指标
查看详情
vqa-v2-test-std
最佳模型: LXMERT (low-magnitude pruning)
评估指标
查看详情
coco
评估指标
查看详情
coco-visual-question-answering-vqa-real-2
评估指标
查看详情
gqa
评估指标
查看详情
mapeval-visual
评估指标
查看详情
mm-vet-v2
评估指标
查看详情
mmhal-bench
评估指标
查看详情
msvd-qa
评估指标
查看详情
plotqa-d1
评估指标
查看详情
plotqa-d2
评估指标
查看详情
vqa-v2-val
评估指标
查看详情