Open Domain Question Answering On Kilt 2
المقاييس
EM
F1
KILT-EM
KILT-F1
R-Prec
Recall@5
النتائج
نتائج أداء النماذج المختلفة على هذا المعيار القياسي
جدول المقارنة
اسم النموذج | EM | F1 | KILT-EM | KILT-F1 | R-Prec | Recall@5 |
---|---|---|---|---|---|---|
النموذج 1 | 72.73 | 79.54 | 45.55 | 49.57 | 58.85 | 71.55 |
النموذج 2 | 32.39 | 39.85 | 0.0 | 0.0 | 0.0 | 0.0 |
النموذج 3 | 59.6 | 66.53 | 42.36 | 46.19 | 61.49 | 68.33 |
kilt-a-benchmark-for-knowledge-intensive | 18.11 | 27.83 | 0.0 | 0.0 | 0.0 | 0.0 |
النموذج 5 | 0.0 | 0.0 | 0.0 | 0.0 | 69.16 | 75.07 |
النموذج 6 | 58.55 | 67.79 | 31.4 | 35.34 | 44.49 | 56.99 |
النموذج 7 | 71.27 | 75.88 | 38.13 | 40.15 | 48.68 | 57.13 |
النموذج 8 | 73.06 | 80.33 | 0.0 | 0.0 | 0.0 | 0.0 |
النموذج 9 | 0.0 | 0.0 | 0.0 | 0.0 | 70.19 | 75.64 |
re2g-retrieve-rerank-generate-2 | 76.27 | 81.4 | 57.91 | 61.78 | 72.68 | 74.23 |
النموذج 11 | 60.99 | 66.55 | 42.85 | 46.08 | 60.49 | 63.54 |
النموذج 12 | 0.0 | 0.0 | 0.0 | 0.0 | 61.49 | 68.33 |
النموذج 13 | 0.0 | 0.0 | 0.0 | 0.0 | 70.36 | 69.16 |
النموذج 14 | 70.38 | 74.41 | 34.48 | 36.28 | 43.4 | 31.45 |
النموذج 15 | 70.86 | 77.29 | 50.56 | 54.99 | 68.36 | 76.36 |