HyperAI超神経

Visual Question Answering 1

ベンチマークリスト

このタスクに関連するすべてのベンチマーク

amber
最高モデル: RLAIF-V 12B

評価指標

詳細を表示
benchlmm
最高モデル: GPT-4V

評価指標

詳細を表示
clevr
最高モデル: NeSyCoCo Neuro-Symbolic

評価指標

詳細を表示
earthvqa
最高モデル: SOBA

評価指標

詳細を表示
grit
最高モデル: OFA

評価指標

詳細を表示
mm-vet
最高モデル: Gemini 1.5 Pro (gemini-1.5-pro-002)

評価指標

詳細を表示
mm-vet-w-o-external-tools
最高モデル: Emu-14B

評価指標

詳細を表示
mmbench
最高モデル: LLaVA-InternLM2-ViT + MoSLoRA

評価指標

詳細を表示
msrvtt-qa
最高モデル: Aurora (ours, r=64) Aurora (ours, r=64)

評価指標

詳細を表示
textvqa-test-standard
最高モデル: PromptCap

評価指標

詳細を表示
v-bench
最高モデル: IVM-Enhanced GPT4-V

評価指標

詳細を表示
vip-bench
最高モデル: GPT-4V-turbo-detail:high (Visual Prompt)

評価指標

詳細を表示
visualmrc
最高モデル: LayoutT5 (Large)

評価指標

詳細を表示
vizwiz
最高モデル: Emu-I *

評価指標

詳細を表示
vqa-v2
最高モデル: RLHF-V

評価指標

詳細を表示
vqa-v2-test-dev
最高モデル: BLIP-2 ViT-G OPT 6.7B (fine-tuned)

評価指標

詳細を表示
vqa-v2-test-std
最高モデル: LXMERT (low-magnitude pruning)

評価指標

詳細を表示
coco

評価指標

詳細を表示
coco-visual-question-answering-vqa-real-2

評価指標

詳細を表示
gqa

評価指標

詳細を表示
mapeval-visual

評価指標

詳細を表示
mm-vet-v2

評価指標

詳細を表示
mmhal-bench

評価指標

詳細を表示
msvd-qa

評価指標

詳細を表示
plotqa-d1

評価指標

詳細を表示
plotqa-d2

評価指標

詳細を表示
vqa-v2-val

評価指標

詳細を表示