HyperAI초신경

Mathematical Reasoning On Pgps9K

평가 지표

Completion accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Completion accuracy
a-multi-modal-neural-geometric-solver-with62.7
geoqa-a-geometric-question-answering34.1
inter-gps-interpretable-geometry-problem59.8
unigeo-unifying-geometry-logical-reasoning35.6
gaps-geometry-aware-problem-solver61.2
gold-geometry-problem-solver-with-natural65.8