Mathematical Reasoning On Math500
평가 지표
Acc
평가 결과
이 벤치마크에서 각 모델의 성능 결과
모델 이름 | Acc | Paper Title | Repository |
---|---|---|---|
Search-o1 | 86.4 | Search-o1: Agentic Search-Enhanced Large Reasoning Models |
0 of 1 row(s) selected.
이 벤치마크에서 각 모델의 성능 결과
모델 이름 | Acc | Paper Title | Repository |
---|---|---|---|
Search-o1 | 86.4 | Search-o1: Agentic Search-Enhanced Large Reasoning Models |