Visual Question Answering On Gqa

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

		Paper Title
PEVL+	77	PEVL: Position-enhanced Pre-training and Prompt Tuning for Vision-language Models
RelViT	65.54	RelViT: Concept-guided Vision Transformer for Visual Relational Reasoning

0 of 2 row(s) selected.