HyperAI超神経

Multiple Choice Question Answering Mcqa On 16

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
galactica-a-large-language-model-for-science-123.7
galactica-a-large-language-model-for-science-131.9
galactica-a-large-language-model-for-science-127
galactica-a-large-language-model-for-science-132.6
galactica-a-large-language-model-for-science-124.4