HyperAIHyperAI

Video Question Answering On Tgif Qa

Métriques

Accuracy

Résultats

Résultats de performance de divers modèles sur ce benchmark

Nom du modèle
Accuracy
Paper TitleRepository
LocVLM-Vid-B51.8Learning to Localize Objects Improves Spatial Reasoning in Visual-LLMs
0 of 1 row(s) selected.
Video Question Answering On Tgif Qa | SOTA | HyperAI