Coreference Resolution On Conll12
평가 지표
Average F1
B3
CEAFϕ4
MUC
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Average F1 | B3 | CEAFϕ4 | MUC |
---|---|---|---|---|
deepstruct-pretraining-of-language-models-for-1 | 60.6 | 57.7 | 60.2 | 63.9 |
deepstruct-pretraining-of-language-models-for-1 | 73.1 | 71.3 | 73.1 | 74.9 |