HyperAI

Question Answering On Convfinqa

Métriques

Execution Accuracy

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleExecution Accuracy
are-chatgpt-and-gpt-4-general-purpose-solvers46.90
convfinqa-exploring-the-chain-of-numerical68.9
are-chatgpt-and-gpt-4-general-purpose-solvers76.48