Video Question Answering
ベンチマークリスト
このタスクに関連するすべてのベンチマーク
activitynet-qa
最高モデル: VideoChat2
評価指標
詳細を表示
agqa-2-0-balanced
最高モデル: GF (sup) - Faster RCNN
評価指標
詳細を表示
how2qa
最高モデル: Text + Text (no Multimodal Pretext Training)
評価指標
詳細を表示
howto100m-qa
最高モデル: TimeSformer
評価指標
詳細を表示
intentqa
最高モデル: VideoChat2_mistral
評価指標
詳細を表示
ivqa
最高モデル: FrozenBiLM
評価指標
詳細を表示
lsmdc-fib
最高モデル: Clover
評価指標
詳細を表示
lsmdc-mc
最高モデル: VIOLETv2
評価指標
詳細を表示
msr-vtt-mc
最高モデル: ATP (1<-16)
評価指標
詳細を表示
msrvtt-mc
最高モデル: Singularity-temporal
評価指標
詳細を表示
msrvtt-qa
最高モデル: FrozenBiLM
評価指標
詳細を表示
mvbench
最高モデル: Tarsier (34B)
評価指標
詳細を表示
next-qa
最高モデル: LinVT-Qwen2-VL
(7B)
評価指標
詳細を表示
next-qa-efficient
最高モデル: ViLA (3B, 4 frames)
評価指標
詳細を表示
perception-test
最高モデル: Oyrx (34B)
評価指標
詳細を表示
roadtextvqa
最高モデル: GIT
評価指標
詳細を表示
situated-reasoning-star
最高モデル: VLAP (4 frames)
評価指標
詳細を表示
tvbench
最高モデル: Tarsier-34B
評価指標
詳細を表示
tvqa
最高モデル: LLaMA-VQA
評価指標
詳細を表示
videoqa
最高モデル: Just Ask (fine-tune)
評価指標
詳細を表示
dramaqa
評価指標
詳細を表示
msr-vtt
評価指標
詳細を表示
msvd-qa
評価指標
詳細を表示
trafficqa
評価指標
詳細を表示
tgif-qa
評価指標
詳細を表示
vlep
評価指標
詳細を表示
wildqa
評価指標
詳細を表示