HyperAI超神経

Math Word Problem Solving On Gsm Plus

評価指標

1:1 Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名1:1 Accuracy
gsm-plus-a-comprehensive-benchmark-for85.6