Visual Question Answering 1
ベンチマークリスト
このタスクに関連するすべてのベンチマーク
amber
最高モデル: RLAIF-V 12B
評価指標
詳細を表示
benchlmm
最高モデル: GPT-4V
評価指標
詳細を表示
clevr
最高モデル: NeSyCoCo Neuro-Symbolic
評価指標
詳細を表示
earthvqa
最高モデル: SOBA
評価指標
詳細を表示
grit
最高モデル: OFA
評価指標
詳細を表示
mm-vet
最高モデル: Gemini 1.5 Pro (gemini-1.5-pro-002)
評価指標
詳細を表示
mm-vet-w-o-external-tools
最高モデル: Emu-14B
評価指標
詳細を表示
mmbench
最高モデル: LLaVA-InternLM2-ViT + MoSLoRA
評価指標
詳細を表示
msrvtt-qa
最高モデル: Aurora (ours, r=64) Aurora (ours, r=64)
評価指標
詳細を表示
textvqa-test-standard
最高モデル: PromptCap
評価指標
詳細を表示
v-bench
最高モデル: IVM-Enhanced GPT4-V
評価指標
詳細を表示
vip-bench
最高モデル: GPT-4V-turbo-detail:high (Visual Prompt)
評価指標
詳細を表示
visualmrc
最高モデル: LayoutT5 (Large)
評価指標
詳細を表示
vizwiz
最高モデル: Emu-I *
評価指標
詳細を表示
vqa-v2
最高モデル: RLHF-V
評価指標
詳細を表示
vqa-v2-test-dev
最高モデル: BLIP-2 ViT-G OPT 6.7B (fine-tuned)
評価指標
詳細を表示
vqa-v2-test-std
最高モデル: LXMERT (low-magnitude pruning)
評価指標
詳細を表示
coco
評価指標
詳細を表示
coco-visual-question-answering-vqa-real-2
評価指標
詳細を表示
gqa
評価指標
詳細を表示
mapeval-visual
評価指標
詳細を表示
mm-vet-v2
評価指標
詳細を表示
mmhal-bench
評価指標
詳細を表示
msvd-qa
評価指標
詳細を表示
plotqa-d1
評価指標
詳細を表示
plotqa-d2
評価指標
詳細を表示
vqa-v2-val
評価指標
詳細を表示