HyperAI초신경

Mathematical Reasoning On Frontiermath

평가 지표

Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Accuracy
모델 10.01
모델 20.01
모델 30.01
모델 40.01
모델 50.252
frontiermath-a-benchmark-for-evaluating0.02