Mmlu
평가 지표
key
mmlu
mmluhumanities
mmluother
mmlusocialscience
mmlustem
model
num
org
rank
time
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | key | mmlu | mmluhumanities | mmluother | mmlusocialscience | mmlustem | model | num | org | rank | time |
---|---|---|---|---|---|---|---|---|---|---|---|
모델 1 | 1.000000 | 83.000000 | 87.000000 | 83.600000 | 89.800000 | 75.700000 | GPT-4 | N/A | OpenAI | 1.000000 | 2023/3/15 |