Story Generation On Tvmegasite Test
평가 지표
BLEU
Perplexity
ROUGE-1
ROUGE-2
ROUGE-L
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | BLEU | Perplexity | ROUGE-1 | ROUGE-2 | ROUGE-L |
---|---|---|---|---|---|
tvrecap-a-dataset-for-generating-stories-with | 28.1 | 18.3 | 67.0 | 40.9 | 66.2 |
이 벤치마크에서 각 모델의 성능 결과
모델 이름 | BLEU | Perplexity | ROUGE-1 | ROUGE-2 | ROUGE-L |
---|---|---|---|---|---|
tvrecap-a-dataset-for-generating-stories-with | 28.1 | 18.3 | 67.0 | 40.9 | 66.2 |