HyperAI

Mmlu

Métriques

key
mmlu
mmluhumanities
mmluother
mmlusocialscience
mmlustem
model
num
org
rank
time

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèlekeymmlummluhumanitiesmmluothermmlusocialsciencemmlustemmodelnumorgranktime
Modèle 11.00000083.00000087.00000083.60000089.80000075.700000GPT-4N/AOpenAI1.0000002023/3/15