HyperAI超神経

Question Answering On Muld Narrativeqa

評価指標

BLEU-1
BLEU-4
METEOR
Rouge-L

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

モデル名
BLEU-1
BLEU-4
METEOR
Rouge-L
Paper TitleRepository
Longformer19.84624.5222.09MuLD: The Multitask Long Document Benchmark
T517.67553.3619.03MuLD: The Multitask Long Document Benchmark
0 of 2 row(s) selected.