HyperAI

Text To Sql On Bird Big Bench For Large Scale

Métriques

Execution Accuracy % (Dev)
Execution Accuracy % (Test)

Résultats

Résultats de performance de divers modèles sur ce benchmark

Tableau comparatif
Nom du modèleExecution Accuracy % (Dev)Execution Accuracy % (Test)
Modèle 168.1270.21
msc-sql-multi-sample-critiquing-small65.6-
Modèle 359.7160.71
Modèle 458.4760.37
Modèle 562.9764.51
text-to-sql-empowered-by-large-language54.7657.41
can-llm-already-serve-as-a-database-interface37.2239.30
Modèle 855.4863.39
Modèle 972.4373.17
can-llm-already-serve-as-a-database-interface--
Modèle 1155.4863.39
can-llms-effectively-leverage-structural42.7049.02
Modèle 1364.7365.23
Modèle 1467.9966.21
Modèle 1565.4568.87
Modèle 1663.3665.45
can-llm-already-serve-as-a-database-interface34.3536.47
chase-sql-multi-path-reasoning-and-preference73.1474.06
xiyan-sql-a-multi-generator-ensemble73.3475.63
Modèle 2069.372.28
chess-contextual-harnessing-for-efficient-sql6566.69
can-llms-effectively-leverage-structural46.3554.89
Modèle 2360.564.84
Modèle 2462.5863.22
Modèle 2557.1759.25
Modèle 2658.562.66
mac-sql-multi-agent-collaboration-for-text-to57.5659.59
Modèle 2866.8264.00
Modèle 2965.3867.86
Modèle 3064.62-
knowledge-to-sql-enhancing-sql-generation48.92-
the-death-of-schema-linking-text-to-sql-in67.2171.83
can-llm-already-serve-as-a-database-interface36.6440.08
Modèle 3437.6847.74
din-sql-decomposed-in-context-learning-of-150.7255.90
Modèle 3666.9569.03
Modèle 3772.1670.26
can-llm-already-serve-as-a-database-interface27.3833.04
Modèle 3974.3274.12
Modèle 4061.3464.95