Zeroshot Video Question Answer
Liste des benchmarks
Tous les benchmarks liés à cette tâche
egoschema-subset
Meilleur modèle: Tarsier (34B)
Métriques
Voir les détails
egoschema-fullset
Meilleur modèle: BIMBA-LLaVA-Qwen2-7B
Métriques
Voir les détails
intentqa
Meilleur modèle: IG-VLM
Métriques
Voir les détails
mvbench
Meilleur modèle: TS-LLaVA-34B
Métriques
Voir les détails
next-qa
Meilleur modèle: Tarsier (34B)
Métriques
Voir les détails
situated-reasoning-star
Meilleur modèle: VideoChat2
Métriques
Voir les détails
tvqa
Meilleur modèle: FrozenBiLM (with speech)
Métriques
Voir les détails
video-mme-w-o-subs
Meilleur modèle: Video-RAG (based on LLaVA-Video)
Métriques
Voir les détails
video-mme
Meilleur modèle: Gemini 1.5 Pro
Métriques
Voir les détails
zero-shot-video-question-answering-on
Meilleur modèle: Gemini 1.5 Pro
Métriques
Voir les détails
activitynet-qa
Meilleur modèle: IG-VLM
Métriques
Voir les détails
msrvtt-qa
Meilleur modèle: Flash-VStream
Métriques
Voir les détails
msvd-qa
Meilleur modèle: Video-LLaVA-7B
Métriques
Voir les détails
tgif-qa
Meilleur modèle: PLLaVA
Métriques
Voir les détails
cinepile
Métriques
Voir les détails
next-gqa
Métriques
Voir les détails