Automated Theorem Proving On Minif2F 1
평가 지표
Pass@64
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Pass@64 |
---|---|
hypertree-proof-search-for-neural-theorem | 32.1 |
hypertree-proof-search-for-neural-theorem | 33.6 |
hypertree-proof-search-for-neural-theorem | 30.6 |
hypertree-proof-search-for-neural-theorem | 42.5 |