Question Answering On Convfinqa
평가 지표
Execution Accuracy
평가 결과
이 벤치마크에서 각 모델의 성능 결과
비교 표
모델 이름 | Execution Accuracy |
---|---|
are-chatgpt-and-gpt-4-general-purpose-solvers | 46.90 |
convfinqa-exploring-the-chain-of-numerical | 68.9 |
are-chatgpt-and-gpt-4-general-purpose-solvers | 76.48 |