Video Question Answering
قائمة المعايير القياسية
جميع المعايير القياسية المتعلقة بهذه المهمة
activitynet-qa
أفضل نموذج: VideoChat2
المقاييس
عرض التفاصيل
agqa-2-0-balanced
أفضل نموذج: GF (sup) - Faster RCNN
المقاييس
عرض التفاصيل
how2qa
أفضل نموذج: Text + Text (no Multimodal Pretext Training)
المقاييس
عرض التفاصيل
howto100m-qa
أفضل نموذج: TimeSformer
المقاييس
عرض التفاصيل
intentqa
أفضل نموذج: VideoChat2_mistral
المقاييس
عرض التفاصيل
ivqa
أفضل نموذج: FrozenBiLM
المقاييس
عرض التفاصيل
lsmdc-fib
أفضل نموذج: Clover
المقاييس
عرض التفاصيل
lsmdc-mc
أفضل نموذج: VIOLETv2
المقاييس
عرض التفاصيل
msr-vtt-mc
أفضل نموذج: ATP (1<-16)
المقاييس
عرض التفاصيل
msrvtt-mc
أفضل نموذج: Singularity-temporal
المقاييس
عرض التفاصيل
msrvtt-qa
أفضل نموذج: FrozenBiLM
المقاييس
عرض التفاصيل
mvbench
أفضل نموذج: Tarsier (34B)
المقاييس
عرض التفاصيل
next-qa
أفضل نموذج: LinVT-Qwen2-VL
(7B)
المقاييس
عرض التفاصيل
next-qa-efficient
أفضل نموذج: ViLA (3B, 4 frames)
المقاييس
عرض التفاصيل
perception-test
أفضل نموذج: Oyrx (34B)
المقاييس
عرض التفاصيل
roadtextvqa
أفضل نموذج: GIT
المقاييس
عرض التفاصيل
situated-reasoning-star
أفضل نموذج: VLAP (4 frames)
المقاييس
عرض التفاصيل
tvbench
أفضل نموذج: Tarsier-34B
المقاييس
عرض التفاصيل
tvqa
أفضل نموذج: LLaMA-VQA
المقاييس
عرض التفاصيل
videoqa
أفضل نموذج: Just Ask (fine-tune)
المقاييس
عرض التفاصيل
dramaqa
المقاييس
عرض التفاصيل
msr-vtt
المقاييس
عرض التفاصيل
msvd-qa
المقاييس
عرض التفاصيل
trafficqa
المقاييس
عرض التفاصيل
tgif-qa
المقاييس
عرض التفاصيل
vlep
المقاييس
عرض التفاصيل
wildqa
المقاييس
عرض التفاصيل