Natural Language Inference On Terra
評価指標
Accuracy
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Accuracy |
---|---|
モデル 1 | 0.605 |
モデル 2 | 0.488 |
モデル 3 | 0.617 |
モデル 4 | 0.703 |
モデル 5 | 0.637 |
モデル 6 | 0.642 |
mt5-a-massively-multilingual-pre-trained-text | 0.561 |
モデル 8 | 0.573 |
unreasonable-effectiveness-of-rule-based | 0.483 |
モデル 10 | 0.704 |
モデル 11 | 0.637 |
モデル 12 | 0.871 |
モデル 13 | 0.64 |
モデル 14 | 0.801 |
モデル 15 | 0.747 |
unreasonable-effectiveness-of-rule-based | 0.549 |
モデル 17 | 0.692 |
russiansuperglue-a-russian-language | 0.92 |
unreasonable-effectiveness-of-rule-based | 0.513 |
モデル 20 | 0.654 |
モデル 21 | 0.505 |
russiansuperglue-a-russian-language | 0.471 |