HyperAI超神経

Question Answering On Muld Hotpotqa

評価指標

BLEU-1
BLEU-4
METEOR
Rouge-L

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名BLEU-1BLEU-4METEORRouge-L
muld-the-multitask-long-document-benchmark30.3816.764.9830.49
muld-the-multitask-long-document-benchmark28.1113.634.4627.61