HyperAI超神経

Cmmlu

評価指標

cmmlu
cmmluchinaspecific
cmmluhumanities
cmmluother
cmmlusocialscience
cmmlustem
key
model
num
org
rank
time

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

モデル名
cmmlu
cmmluchinaspecific
cmmluhumanities
cmmluother
cmmlusocialscience
cmmlustem
key
model
num
org
rank
time
Paper TitleRepository
Base83.60000083.70000087.50000086.10000084.30000077.5000001.000000Qwen-72B72BAlibaba1.0000002023/11/30--
0 of 1 row(s) selected.