HyperAI

Logical Reasoning On Ruworldtree

Métriques

Accuracy

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAccuracy
tape-assessing-few-shot-russian-language38.0
tape-assessing-few-shot-russian-language83.7
tape-assessing-few-shot-russian-language34.0
tape-assessing-few-shot-russian-language40.7