HyperAI

Common Sense Reasoning On Rwsd

Métriques

Accuracy

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleAccuracy
Modèle 10.669
Modèle 20.571
Modèle 30.669
russiansuperglue-a-russian-language0.662
russiansuperglue-a-russian-language0.84
Modèle 60.636
Modèle 70.649
Modèle 80.545
Modèle 90.669
Modèle 100.675
mt5-a-massively-multilingual-pre-trained-text0.669
Modèle 120.669
unreasonable-effectiveness-of-rule-based0.669
Modèle 140.669
unreasonable-effectiveness-of-rule-based0.597
Modèle 160.669
Modèle 170.662
Modèle 180.669
Modèle 190.669
unreasonable-effectiveness-of-rule-based0.669
Modèle 210.669
Modèle 220.669