HyperAI초신경

Video Question Answering On Perception Test

평가 지표

Accuracy (Top-1)

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Accuracy (Top-1)
traveler-a-multi-lmm-agent-framework-for50.2
videollama-2-advancing-spatial-temporal57.5
internvideo2-scaling-video-foundation-models63.4
bimba-selective-scan-compression-for-long68.51
oryx-mllm-on-demand-spatial-temporal71.4
perception-test-a-diagnostic-benchmark-for-20.46