HyperAI초신경

Multimodal Reasoning On Math V

평가 지표

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Accuracy
measuring-multimodal-mathematical-reasoning14.54
measuring-multimodal-mathematical-reasoning17.66
measuring-multimodal-mathematical-reasoning15.59
measuring-multimodal-mathematical-reasoning22.76