Question Answering On Muld Narrativeqa
Métriques
BLEU-1
BLEU-4
METEOR
Rouge-L
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | BLEU-1 | BLEU-4 | METEOR | Rouge-L |
---|---|---|---|---|
muld-the-multitask-long-document-benchmark | 19.84 | 62 | 4.52 | 22.09 |
muld-the-multitask-long-document-benchmark | 17.67 | 55 | 3.36 | 19.03 |