HyperAI超神経

Multiple Choice Question Answering Mcqa On 10

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
galactica-a-large-language-model-for-science-127.6
galactica-a-large-language-model-for-science-133.6
galactica-a-large-language-model-for-science-141.5
galactica-a-large-language-model-for-science-125.7
galactica-a-large-language-model-for-science-138.1