HyperAI

Question Answering On Convfinqa

Metriken

Execution Accuracy

Ergebnisse

Leistungsergebnisse verschiedener Modelle zu diesem Benchmark

Vergleichstabelle
ModellnameExecution Accuracy
are-chatgpt-and-gpt-4-general-purpose-solvers46.90
convfinqa-exploring-the-chain-of-numerical68.9
are-chatgpt-and-gpt-4-general-purpose-solvers76.48