Story Generation On Tvmegasite Dev
評価指標
BLEU
Perplexity
ROUGE-1
ROUGE-2
ROUGE-L
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | BLEU | Perplexity | ROUGE-1 | ROUGE-2 | ROUGE-L |
---|---|---|---|---|---|
tvrecap-a-dataset-for-generating-stories-with | 30.9 | 15.7 | 68.3 | 44.0 | 67.5 |
このベンチマークにおける各モデルのパフォーマンス結果
モデル名 | BLEU | Perplexity | ROUGE-1 | ROUGE-2 | ROUGE-L |
---|---|---|---|---|---|
tvrecap-a-dataset-for-generating-stories-with | 30.9 | 15.7 | 68.3 | 44.0 | 67.5 |