HyperAI

Text Summarization On Reddit Tifu

Métriques

ROUGE-1
ROUGE-2
ROUGE-L

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleROUGE-1ROUGE-2ROUGE-L
extractive-summarization-as-text-matching25.096.1720.13
muppet-massive-multi-task-representations30.311.2524.92
summareranker-a-multi-task-mixture-of-experts-129.839.523.47
calibrating-sequence-likelihood-improves32.0311.1325.51
better-fine-tuning-by-reducing30.3110.9824.74