HyperAI초신경

Mmlu

평가 지표

key
mmlu
mmluhumanities
mmluother
mmlusocialscience
mmlustem
model
num
org
rank
time

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름keymmlummluhumanitiesmmluothermmlusocialsciencemmlustemmodelnumorgranktime
모델 11.00000083.00000087.00000083.60000089.80000075.700000GPT-4N/AOpenAI1.0000002023/3/15