HyperAI초신경

Question Answering On Convfinqa

평가 지표

Execution Accuracy

평가 결과

이 벤치마크에서 각 모델의 성능 결과

비교 표
모델 이름Execution Accuracy
are-chatgpt-and-gpt-4-general-purpose-solvers46.90
convfinqa-exploring-the-chain-of-numerical68.9
are-chatgpt-and-gpt-4-general-purpose-solvers76.48