Question Answering On Ms Marco
Métriques
BLEU-1
Rouge-L
Résultats
Résultats de performance de divers modèles sur ce benchmark
Tableau comparatif
Nom du modèle | BLEU-1 | Rouge-L |
---|---|---|
multi-style-generative-reading-comprehension | 43.77 | 52.2 |
bidirectional-attention-flow-for-machine | 10.64 | 23.96 |
a-deep-cascade-model-for-multi-document | 54.64 | 52.01 |
multi-passage-machine-reading-comprehension | 54.37 | 51.63 |