Visual Question Answering 1
벤치마크 목록
해당 작업에 관련된 모든 벤치마크 목록
amber
최고 모델: RLAIF-V 12B
평가 지표
세부 정보 보기
benchlmm
최고 모델: GPT-4V
평가 지표
세부 정보 보기
clevr
최고 모델: NeSyCoCo Neuro-Symbolic
평가 지표
세부 정보 보기
earthvqa
최고 모델: SOBA
평가 지표
세부 정보 보기
grit
최고 모델: OFA
평가 지표
세부 정보 보기
mm-vet
최고 모델: Gemini 1.5 Pro (gemini-1.5-pro-002)
평가 지표
세부 정보 보기
mm-vet-w-o-external-tools
최고 모델: Emu-14B
평가 지표
세부 정보 보기
mmbench
최고 모델: LLaVA-InternLM2-ViT + MoSLoRA
평가 지표
세부 정보 보기
msrvtt-qa
최고 모델: Aurora (ours, r=64) Aurora (ours, r=64)
평가 지표
세부 정보 보기
textvqa-test-standard
최고 모델: PromptCap
평가 지표
세부 정보 보기
v-bench
최고 모델: IVM-Enhanced GPT4-V
평가 지표
세부 정보 보기
vip-bench
최고 모델: GPT-4V-turbo-detail:high (Visual Prompt)
평가 지표
세부 정보 보기
visualmrc
최고 모델: LayoutT5 (Large)
평가 지표
세부 정보 보기
vizwiz
최고 모델: Emu-I *
평가 지표
세부 정보 보기
vqa-v2
최고 모델: RLHF-V
평가 지표
세부 정보 보기
vqa-v2-test-dev
최고 모델: BLIP-2 ViT-G OPT 6.7B (fine-tuned)
평가 지표
세부 정보 보기
vqa-v2-test-std
최고 모델: LXMERT (low-magnitude pruning)
평가 지표
세부 정보 보기
coco
평가 지표
세부 정보 보기
coco-visual-question-answering-vqa-real-2
평가 지표
세부 정보 보기
gqa
평가 지표
세부 정보 보기
mapeval-visual
평가 지표
세부 정보 보기
mm-vet-v2
평가 지표
세부 정보 보기
mmhal-bench
평가 지표
세부 정보 보기
msvd-qa
평가 지표
세부 정보 보기
plotqa-d1
평가 지표
세부 정보 보기
plotqa-d2
평가 지표
세부 정보 보기
vqa-v2-val
평가 지표
세부 정보 보기