Translation On Muld Opensubtitles
평가 지표
BLEU-1
BLEU-4
METEOR
Rouge-L
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | BLEU-1 | BLEU-4 | METEOR | Rouge-L |
---|---|---|---|---|
muld-the-multitask-long-document-benchmark | 22.74 | 20 | 22.95 | 22.17 |
muld-the-multitask-long-document-benchmark | 34.07 | 1.63 | 38.53 | 35.35 |