HyperAI초신경

Visual Question Answering 1

벤치마크 목록

해당 작업에 관련된 모든 벤치마크 목록

amber
최고 모델: RLAIF-V 12B

평가 지표

세부 정보 보기
benchlmm
최고 모델: GPT-4V

평가 지표

세부 정보 보기
clevr
최고 모델: NeSyCoCo Neuro-Symbolic

평가 지표

세부 정보 보기
earthvqa
최고 모델: SOBA

평가 지표

세부 정보 보기
grit
최고 모델: OFA

평가 지표

세부 정보 보기
mm-vet
최고 모델: Gemini 1.5 Pro (gemini-1.5-pro-002)

평가 지표

세부 정보 보기
mm-vet-w-o-external-tools
최고 모델: Emu-14B

평가 지표

세부 정보 보기
mmbench
최고 모델: LLaVA-InternLM2-ViT + MoSLoRA

평가 지표

세부 정보 보기
msrvtt-qa
최고 모델: Aurora (ours, r=64) Aurora (ours, r=64)

평가 지표

세부 정보 보기
textvqa-test-standard
최고 모델: PromptCap

평가 지표

세부 정보 보기
v-bench
최고 모델: IVM-Enhanced GPT4-V

평가 지표

세부 정보 보기
vip-bench
최고 모델: GPT-4V-turbo-detail:high (Visual Prompt)

평가 지표

세부 정보 보기
visualmrc
최고 모델: LayoutT5 (Large)

평가 지표

세부 정보 보기
vizwiz
최고 모델: Emu-I *

평가 지표

세부 정보 보기
vqa-v2
최고 모델: RLHF-V

평가 지표

세부 정보 보기
vqa-v2-test-dev
최고 모델: BLIP-2 ViT-G OPT 6.7B (fine-tuned)

평가 지표

세부 정보 보기
vqa-v2-test-std
최고 모델: LXMERT (low-magnitude pruning)

평가 지표

세부 정보 보기
coco

평가 지표

세부 정보 보기
coco-visual-question-answering-vqa-real-2

평가 지표

세부 정보 보기
gqa

평가 지표

세부 정보 보기
mapeval-visual

평가 지표

세부 정보 보기
mm-vet-v2

평가 지표

세부 정보 보기
mmhal-bench

평가 지표

세부 정보 보기
msvd-qa

평가 지표

세부 정보 보기
plotqa-d1

평가 지표

세부 정보 보기
plotqa-d2

평가 지표

세부 정보 보기
vqa-v2-val

평가 지표

세부 정보 보기