Question Answering On Cronquestions
評価指標
Hits@1
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Hits@1 |
---|---|
time-aware-multiway-adaptive-fusion-network | 78.4 |
モデル 2 | 15.1 |
モデル 3 | 28.8 |
tempoqr-temporal-question-reasoning-over | 24.3 |
モデル 5 | 28.8 |
モデル 6 | 75.4 |
tempoqr-temporal-question-reasoning-over | 74.5 |
モデル 8 | 81.1 |
モデル 9 | 7.1 |
question-calibration-and-multi-hop-modeling | 97.1 |
モデル 11 | 22.6 |
self-improvement-programming-for-temporal | 93.7 |
improving-time-sensitivity-for-question | 83.1 |
モデル 14 | 92 |
two-stage-generative-question-answering-on | 97.8 |
モデル 16 | 96.9 |
モデル 17 | 7 |
モデル 18 | 80.6 |
tempoqr-temporal-question-reasoning-over | 91.8 |
モデル 20 | 92 |
モデル 21 | 96.9 |
temporal-knowledge-graph-question-answering | 96.6 |
モデル 23 | 22.5 |
question-answering-over-temporal-knowledge | 64.7 |
tempoqr-temporal-question-reasoning-over | 79.9 |
モデル 26 | 27.8 |
モデル 27 | 28.8 |
モデル 28 | 90.9 |
モデル 29 | 25.2 |