Visual Question Answering On Tgif Qa

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

		Paper Title
HiTeA	0.732	HiTeA: Hierarchical Temporal-Aware Video-Language Pre-training
InternVideo	0.722	InternVideo: General Video Foundation Models via Generative and Discriminative Learning

0 of 2 row(s) selected.