HyperAI超神経

Mmlu

評価指標

key
mmlu
mmluhumanities
mmluother
mmlusocialscience
mmlustem
model
num
org
rank
time

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名keymmlummluhumanitiesmmluothermmlusocialsciencemmlustemmodelnumorgranktime
モデル 11.00000083.00000087.00000083.60000089.80000075.700000GPT-4N/AOpenAI1.0000002023/3/15