HyperAI초신경

Automated Theorem Proving On Coqgym

평가 지표

Percentage correct

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Percentage correct
learning-to-prove-theorems-via-interacting12.2