Mmlu
評価指標
key
mmlu
mmluhumanities
mmluother
mmlusocialscience
mmlustem
model
num
org
rank
time
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | key | mmlu | mmluhumanities | mmluother | mmlusocialscience | mmlustem | model | num | org | rank | time |
---|---|---|---|---|---|---|---|---|---|---|---|
モデル 1 | 1.000000 | 83.000000 | 87.000000 | 83.600000 | 89.800000 | 75.700000 | GPT-4 | N/A | OpenAI | 1.000000 | 2023/3/15 |