Cmmlu
評価指標
cmmlu
cmmluchinaspecific
cmmluhumanities
cmmluother
cmmlusocialscience
cmmlustem
key
model
num
org
rank
time
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | cmmlu | cmmluchinaspecific | cmmluhumanities | cmmluother | cmmlusocialscience | cmmlustem | key | model | num | org | rank | time |
---|---|---|---|---|---|---|---|---|---|---|---|---|
モデル 1 | 83.600000 | 83.700000 | 87.500000 | 86.100000 | 84.300000 | 77.500000 | 1.000000 | Qwen-72B | 72B | Alibaba | 1.000000 | 2023/11/30 |