HyperAI

Human Organs Senses Multiple Choice On Big

Métriques

Accuracy

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAccuracy
training-compute-optimal-large-language85.7
scaling-language-models-methods-analysis-184.8