Mathematical Reasoning On Pgps9K
평가 지표
Completion accuracy
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Completion accuracy |
---|---|
a-multi-modal-neural-geometric-solver-with | 62.7 |
geoqa-a-geometric-question-answering | 34.1 |
inter-gps-interpretable-geometry-problem | 59.8 |
unigeo-unifying-geometry-logical-reasoning | 35.6 |
gaps-geometry-aware-problem-solver | 61.2 |
gold-geometry-problem-solver-with-natural | 65.8 |