HyperAI超神経

Question Answering On Convfinqa

評価指標

Execution Accuracy

評価結果

このベンチマークにおける各モデルのパフォーマンス結果

比較表
モデル名Execution Accuracy
are-chatgpt-and-gpt-4-general-purpose-solvers46.90
convfinqa-exploring-the-chain-of-numerical68.9
are-chatgpt-and-gpt-4-general-purpose-solvers76.48