Reading Comprehension On Reclor
評価指標
Test
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Test |
---|---|
モデル 1 | 69.7 |
モデル 2 | 56.9 |
モデル 3 | 49.8 |
モデル 4 | 77.2 |
モデル 5 | 25.3 |
モデル 6 | 40.5 |
モデル 7 | 63.2 |
モデル 8 | 50.3 |
モデル 9 | 59.2 |
モデル 10 | 79.3 |
モデル 11 | 79.2 |
logiformer-a-two-branch-graph-transformer | 63.5 |
モデル 13 | 62.6 |
モデル 14 | 69.3 |
fact-driven-logical-reasoning | 58.9 |
reclor-a-reading-comprehension-dataset-1 | 50.4 |
モデル 17 | 26.0 |
モデル 18 | 61.7 |
answer-uncertainty-and-unanswerability-in-1 | 71.0 |
モデル 20 | 66.7 |
idol-indicator-oriented-logic-pre-training | 80.6 |
モデル 22 | 80.0 |
モデル 23 | 61.7 |
モデル 24 | 65.6 |
reclor-a-reading-comprehension-dataset-1 | 47.3 |
モデル 26 | 60.2 |
モデル 27 | 57.3 |
モデル 28 | 55.6 |
merit-meta-path-guided-contrastive-learning | 79.3 |
reclor-a-reading-comprehension-dataset-1 | 48.5 |
モデル 31 | 60.3 |
logic-driven-context-extension-and-data | 76.1 |
モデル 33 | 57.7 |
モデル 34 | 68.6 |
モデル 35 | 60.2 |
モデル 36 | 57.7 |
モデル 37 | 56.0 |
dagn-discourse-aware-graph-network-for | 58.2 |
reclor-a-reading-comprehension-dataset-1 | 56.0 |