HyperAI

Video Question Answering

قائمة المعايير القياسية

جميع المعايير القياسية المتعلقة بهذه المهمة

activitynet-qa
أفضل نموذج: VideoChat2

المقاييس

عرض التفاصيل
agqa-2-0-balanced
أفضل نموذج: GF (sup) - Faster RCNN

المقاييس

عرض التفاصيل
how2qa
أفضل نموذج: Text + Text (no Multimodal Pretext Training)

المقاييس

عرض التفاصيل
howto100m-qa
أفضل نموذج: TimeSformer

المقاييس

عرض التفاصيل
intentqa
أفضل نموذج: VideoChat2_mistral

المقاييس

عرض التفاصيل
ivqa
أفضل نموذج: FrozenBiLM

المقاييس

عرض التفاصيل
lsmdc-fib
أفضل نموذج: Clover

المقاييس

عرض التفاصيل
lsmdc-mc
أفضل نموذج: VIOLETv2

المقاييس

عرض التفاصيل
msr-vtt-mc
أفضل نموذج: ATP (1<-16)

المقاييس

عرض التفاصيل
msrvtt-mc
أفضل نموذج: Singularity-temporal

المقاييس

عرض التفاصيل
msrvtt-qa
أفضل نموذج: FrozenBiLM

المقاييس

عرض التفاصيل
mvbench
أفضل نموذج: Tarsier (34B)

المقاييس

عرض التفاصيل
next-qa
أفضل نموذج: LinVT-Qwen2-VL (7B)

المقاييس

عرض التفاصيل
next-qa-efficient
أفضل نموذج: ViLA (3B, 4 frames)

المقاييس

عرض التفاصيل
perception-test
أفضل نموذج: Oyrx (34B)

المقاييس

عرض التفاصيل
roadtextvqa
أفضل نموذج: GIT

المقاييس

عرض التفاصيل
situated-reasoning-star
أفضل نموذج: VLAP (4 frames)

المقاييس

عرض التفاصيل
tvbench
أفضل نموذج: Tarsier-34B

المقاييس

عرض التفاصيل
tvqa
أفضل نموذج: LLaMA-VQA

المقاييس

عرض التفاصيل
videoqa
أفضل نموذج: Just Ask (fine-tune)

المقاييس

عرض التفاصيل
dramaqa

المقاييس

عرض التفاصيل
msr-vtt

المقاييس

عرض التفاصيل
msvd-qa

المقاييس

عرض التفاصيل
trafficqa

المقاييس

عرض التفاصيل
tgif-qa

المقاييس

عرض التفاصيل
vlep

المقاييس

عرض التفاصيل
wildqa

المقاييس

عرض التفاصيل