Question Answering On Casehold
평가 지표
Macro F1 (10-fold)
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Macro F1 (10-fold) |
---|---|
when-does-pretraining-help-assessing-self | 61.3 |
when-does-pretraining-help-assessing-self | 68.0 |
when-does-pretraining-help-assessing-self | 69.5 |