Cmmlu
평가 지표
cmmlu
cmmluchinaspecific
cmmluhumanities
cmmluother
cmmlusocialscience
cmmlustem
key
model
num
org
rank
time
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | cmmlu | cmmluchinaspecific | cmmluhumanities | cmmluother | cmmlusocialscience | cmmlustem | key | model | num | org | rank | time |
---|---|---|---|---|---|---|---|---|---|---|---|---|
모델 1 | 83.600000 | 83.700000 | 87.500000 | 86.100000 | 84.300000 | 77.500000 | 1.000000 | Qwen-72B | 72B | Alibaba | 1.000000 | 2023/11/30 |