HyperAI超神経

Video Question Answering

ベンチマークリスト

このタスクに関連するすべてのベンチマーク

activitynet-qa
最高モデル: VideoChat2

評価指標

詳細を表示
agqa-2-0-balanced
最高モデル: GF (sup) - Faster RCNN

評価指標

詳細を表示
how2qa
最高モデル: Text + Text (no Multimodal Pretext Training)

評価指標

詳細を表示
howto100m-qa
最高モデル: TimeSformer

評価指標

詳細を表示
intentqa
最高モデル: VideoChat2_mistral

評価指標

詳細を表示
ivqa
最高モデル: FrozenBiLM

評価指標

詳細を表示
lsmdc-fib
最高モデル: Clover

評価指標

詳細を表示
lsmdc-mc
最高モデル: VIOLETv2

評価指標

詳細を表示
msr-vtt-mc
最高モデル: ATP (1<-16)

評価指標

詳細を表示
msrvtt-mc
最高モデル: Singularity-temporal

評価指標

詳細を表示
msrvtt-qa
最高モデル: FrozenBiLM

評価指標

詳細を表示
mvbench
最高モデル: Tarsier (34B)

評価指標

詳細を表示
next-qa
最高モデル: LinVT-Qwen2-VL (7B)

評価指標

詳細を表示
next-qa-efficient
最高モデル: ViLA (3B, 4 frames)

評価指標

詳細を表示
perception-test
最高モデル: Oyrx (34B)

評価指標

詳細を表示
roadtextvqa
最高モデル: GIT

評価指標

詳細を表示
situated-reasoning-star
最高モデル: VLAP (4 frames)

評価指標

詳細を表示
tvbench
最高モデル: Tarsier-34B

評価指標

詳細を表示
tvqa
最高モデル: LLaMA-VQA

評価指標

詳細を表示
videoqa
最高モデル: Just Ask (fine-tune)

評価指標

詳細を表示
dramaqa

評価指標

詳細を表示
msr-vtt

評価指標

詳細を表示
msvd-qa

評価指標

詳細を表示
trafficqa

評価指標

詳細を表示
tgif-qa

評価指標

詳細を表示
vlep

評価指標

詳細を表示
wildqa

評価指標

詳細を表示