HyperAI초신경

Arithmetic Reasoning On Game Of 24

평가 지표

Success

평가 결과

이 벤치마크에서 각 모델의 성능 결과

모델 이름
Success
Paper TitleRepository
Tree of Thoughts (b=5)0.74Tree of Thoughts: Deliberate Problem Solving with Large Language Models
0 of 1 row(s) selected.