HyperAI超神経

Multiple Choice Question Answering Mcqa On 18

評価指標

Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Accuracy
galactica-a-large-language-model-for-science-142.2
galactica-a-large-language-model-for-science-121.6
galactica-a-large-language-model-for-science-134.3
galactica-a-large-language-model-for-science-118.6
galactica-a-large-language-model-for-science-146.1