Relational Reasoning On Clutrr
평가 지표
10 Hops
4 Hops
5 Hops
6 Hops
7 Hops
8 Hops
9 Hops
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | 10 Hops | 4 Hops | 5 Hops | 6 Hops | 7 Hops | 8 Hops | 9 Hops |
---|---|---|---|---|---|---|---|
learning-reasoning-strategies-in-end-to-end | 0.90 | 0.99 | 0.99 | 0.99 | 0.96 | 0.94 | 0.89 |