HyperAI超神経

Text Summarization On Reddit Tifu

評価指標

ROUGE-1
ROUGE-2
ROUGE-L

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名ROUGE-1ROUGE-2ROUGE-L
extractive-summarization-as-text-matching25.096.1720.13
muppet-massive-multi-task-representations30.311.2524.92
summareranker-a-multi-task-mixture-of-experts-129.839.523.47
calibrating-sequence-likelihood-improves32.0311.1325.51
better-fine-tuning-by-reducing30.3110.9824.74