HyperAI超神経

Cmmlu

評価指標

cmmlu
cmmluchinaspecific
cmmluhumanities
cmmluother
cmmlusocialscience
cmmlustem
key
model
num
org
rank
time

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名cmmlucmmluchinaspecificcmmluhumanitiescmmluothercmmlusocialsciencecmmlustemkeymodelnumorgranktime
モデル 183.60000083.70000087.50000086.10000084.30000077.5000001.000000Qwen-72B72BAlibaba1.0000002023/11/30