Question Answering On Muld Narrativeqa

평가 지표

BLEU-1
BLEU-4
METEOR
Rouge-L

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름
BLEU-1
BLEU-4
METEOR
Rouge-L
Paper TitleRepository
Longformer19.84624.5222.09MuLD: The Multitask Long Document Benchmark
T517.67553.3619.03MuLD: The Multitask Long Document Benchmark
0 of 2 row(s) selected.
Question Answering On Muld Narrativeqa | SOTA | HyperAI초신경