HyperAI超神経

Natural Language Inference On Rcb

評価指標

Accuracy
Average F1

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名AccuracyAverage F1
モデル 10.4180.302
モデル 20.5180.357
モデル 30.5460.406
モデル 40.4630.367
モデル 50.4980.306
russiansuperglue-a-russian-language0.7020.68
モデル 70.5090.333
モデル 8 0.4840.417
モデル 90.4730.356
モデル 100.4470.408
モデル 110.4520.371
モデル 120.4450.367
mt5-a-massively-multilingual-pre-trained-text0.4540.366
モデル 140.50.356
モデル 150.4860.351
モデル 160.4680.307
unreasonable-effectiveness-of-rule-based0.4380.4
unreasonable-effectiveness-of-rule-based0.3740.319
モデル 190.4610.372
モデル 200.4840.452
russiansuperglue-a-russian-language0.4410.301
unreasonable-effectiveness-of-rule-based0.4840.217