Mmlu

評価指標

key
mmlu
mmluhumanities
mmluother
mmlusocialscience
mmlustem
model
num
org
rank
time

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

モデル名
key
mmlu
mmluhumanities
mmluother
mmlusocialscience
mmlustem
model
num
org
rank
time
Paper TitleRepository
Chat1.00000083.00000087.00000083.60000089.80000075.700000GPT-4N/AOpenAI1.0000002023/3/15--
0 of 1 row(s) selected.
Mmlu | SOTA | HyperAI超神経