HyperAI超神経

Question Answering On Muld Narrativeqa

評価指標

BLEU-1
BLEU-4
METEOR
Rouge-L

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名BLEU-1BLEU-4METEORRouge-L
muld-the-multitask-long-document-benchmark19.84624.5222.09
muld-the-multitask-long-document-benchmark17.67553.3619.03