Story Generation On Fandom Test
Métriques
BLEU
Perplexity
ROUGE-1
ROUGE-2
ROUGE-L
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | BLEU | Perplexity | ROUGE-1 | ROUGE-2 | ROUGE-L |
---|---|---|---|---|---|
tvrecap-a-dataset-for-generating-stories-with | 28.4 | 18.2 | 63.2 | 32.9 | 61.5 |