Slot Filling On Kilt T Rex
평가 지표
Accuracy
F1
KILT-AC
KILT-F1
R-Prec
Recall@5
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Accuracy | F1 | KILT-AC | KILT-F1 | R-Prec | Recall@5 |
---|---|---|---|---|---|---|
모델 1 | 19.3 | 25.81 | 0.0 | 0.0 | 0.0 | 0.0 |
모델 2 | 0.0 | 0.0 | 0.0 | 0.0 | 69.46 | 83.88 |
모델 3 | 84.36 | 87.24 | 69.14 | 70.58 | 74.36 | 83.14 |
모델 4 | 45.06 | 49.24 | 0.0 | 0.0 | 0.0 | 0.0 |
모델 5 | 59.2 | 62.96 | 23.12 | 23.94 | 28.68 | 33.04 |
모델 6 | 78.66 | 81.71 | 61.88 | 63.09 | 66.36 | 76.24 |
모델 7 | 0.1 | 7.67 | 0.04 | 6.66 | 79.42 | 85.33 |
모델 8 | 0.0 | 0.0 | 0.0 | 0.0 | 81.9 | 89.36 |
모델 9 | 57.02 | 61.46 | 0.0 | 0.0 | 0.0 | 0.0 |
모델 10 | 83.72 | 86.53 | 60.08 | 61.72 | 67.8 | 81.52 |
모델 11 | 0.02 | 2.04 | 0.0 | 0.0 | 0.0 | 0.0 |
re2g-retrieve-rerank-generate-2 | 87.68 | 89.93 | 75.84 | 77.05 | 80.7 | 89.0 |
모델 13 | 77.9 | 81.31 | 55.54 | 56.79 | 59.7 | 70.38 |
모델 14 | 0.0 | 0.0 | 0.0 | 0.0 | 79.98 | 85.75 |
모델 15 | 49.04 | 54.62 | 36.68 | 39.57 | 48.08 | 51.86 |
kilt-a-benchmark-for-knowledge-intensive | 43.56 | 50.61 | 0.0 | 0.0 | 0.0 | 0.0 |
모델 17 | 59.16 | 62.76 | 11.12 | 11.41 | 13.26 | 17.04 |
모델 18 | 53.9 | 61.74 | 27.84 | 32.34 | 37.62 | 40.07 |
모델 19 | 81.34 | 84.46 | 64.64 | 66.64 | 75.64 | 87.57 |
learning-dense-representations-of-phrases-at | 53.9 | 61.74 | 27.84 | 32.34 | 37.62 | 40.07 |