HyperAI초신경

Question Answering On Muld Hotpotqa

평가 지표

BLEU-1
BLEU-4
METEOR
Rouge-L

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름BLEU-1BLEU-4METEORRouge-L
muld-the-multitask-long-document-benchmark30.3816.764.9830.49
muld-the-multitask-long-document-benchmark28.1113.634.4627.61