HyperAI超神経

Multimodal Reasoning On Math V

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
measuring-multimodal-mathematical-reasoning14.54
measuring-multimodal-mathematical-reasoning17.66
measuring-multimodal-mathematical-reasoning15.59
measuring-multimodal-mathematical-reasoning22.76