HyperAI초신경

Automated Theorem Proving On Minif2F 1

평가 지표

Pass@64

평가 결과

이 벤치마크에서 각 모델의 성능 결과

0 of 4 row(s) selected.