Video Question Answering On Tvqa
평가 지표
Accuracy
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Accuracy |
---|---|
vindlu-a-recipe-for-effective-video-and | 79.0 |
zero-shot-video-question-answering-via-frozen | 82 |
hero-hierarchical-encoder-for-video-language | 74.24 |
iperceive-applying-common-sense-reasoning-to-1 | 76.96 |
large-language-models-are-temporal-and-causal | 82.2 |
tvqa-spatio-temporal-grounding-for-video | 70.50 |