Video Question Answering
Benchmark-Liste
Alle Benchmarks für diese Aufgabe
activitynet-qa
Bestes Modell: VideoChat2
Metriken
Details anzeigen
agqa-2-0-balanced
Bestes Modell: GF (sup) - Faster RCNN
Metriken
Details anzeigen
how2qa
Bestes Modell: Text + Text (no Multimodal Pretext Training)
Metriken
Details anzeigen
howto100m-qa
Bestes Modell: TimeSformer
Metriken
Details anzeigen
intentqa
Bestes Modell: VideoChat2_mistral
Metriken
Details anzeigen
ivqa
Bestes Modell: FrozenBiLM
Metriken
Details anzeigen
lsmdc-fib
Bestes Modell: Clover
Metriken
Details anzeigen
lsmdc-mc
Bestes Modell: VIOLETv2
Metriken
Details anzeigen
msr-vtt-mc
Bestes Modell: ATP (1<-16)
Metriken
Details anzeigen
msrvtt-mc
Bestes Modell: Singularity-temporal
Metriken
Details anzeigen
msrvtt-qa
Bestes Modell: FrozenBiLM
Metriken
Details anzeigen
mvbench
Bestes Modell: Tarsier (34B)
Metriken
Details anzeigen
next-qa
Bestes Modell: LinVT-Qwen2-VL
(7B)
Metriken
Details anzeigen
next-qa-efficient
Bestes Modell: ViLA (3B, 4 frames)
Metriken
Details anzeigen
perception-test
Bestes Modell: Oyrx (34B)
Metriken
Details anzeigen
roadtextvqa
Bestes Modell: GIT
Metriken
Details anzeigen
situated-reasoning-star
Bestes Modell: VLAP (4 frames)
Metriken
Details anzeigen
tvbench
Bestes Modell: Tarsier-34B
Metriken
Details anzeigen
tvqa
Bestes Modell: LLaMA-VQA
Metriken
Details anzeigen
videoqa
Bestes Modell: Just Ask (fine-tune)
Metriken
Details anzeigen
dramaqa
Metriken
Details anzeigen
msr-vtt
Metriken
Details anzeigen
msvd-qa
Metriken
Details anzeigen
trafficqa
Metriken
Details anzeigen
tgif-qa
Metriken
Details anzeigen
vlep
Metriken
Details anzeigen
wildqa
Metriken
Details anzeigen