Question Answering On Casehold
評価指標
Macro F1 (10-fold)
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Macro F1 (10-fold) |
---|---|
when-does-pretraining-help-assessing-self | 61.3 |
when-does-pretraining-help-assessing-self | 68.0 |
when-does-pretraining-help-assessing-self | 69.5 |