Question Answering On Convfinqa
評価指標
Execution Accuracy
評価結果
このベンチマークにおける各モデルのパフォーマンス結果
比較表
モデル名 | Execution Accuracy |
---|---|
are-chatgpt-and-gpt-4-general-purpose-solvers | 46.90 |
convfinqa-exploring-the-chain-of-numerical | 68.9 |
are-chatgpt-and-gpt-4-general-purpose-solvers | 76.48 |