HyperAI초신경

Cmmlu

평가 지표

cmmlu
cmmluchinaspecific
cmmluhumanities
cmmluother
cmmlusocialscience
cmmlustem
key
model
num
org
rank
time

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름cmmlucmmluchinaspecificcmmluhumanitiescmmluothercmmlusocialsciencecmmlustemkeymodelnumorgranktime
모델 183.60000083.70000087.50000086.10000084.30000077.5000001.000000Qwen-72B72BAlibaba1.0000002023/11/30