Multimodal Reasoning On Math V

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

		Paper Title
GPT4V	22.76	Measuring Multimodal Mathematical Reasoning with MATH-Vision Dataset
Gemini Pro	17.66	Measuring Multimodal Mathematical Reasoning with MATH-Vision Dataset
Qwen-VL-Max	15.59	Measuring Multimodal Mathematical Reasoning with MATH-Vision Dataset
InternLM-XComposer2-VL	14.54	Measuring Multimodal Mathematical Reasoning with MATH-Vision Dataset

0 of 4 row(s) selected.