RYANSQL : Application récursive de remplissage de champs basée sur des croquis pour le texte vers SQL complexe dans des bases de données multidomaines

La transformation texte-en-SQL consiste à convertir une question posée par un utilisateur en une requête SQL, étant donné la question et une base de données. Dans cet article, nous présentons une approche basée sur un réseau de neurones appelée RYANSQL (Recursively Yielding Annotation Network for SQL) afin de résoudre des tâches complexes de transformation texte-en-SQL sur des bases de données multidomaines. Nous introduisons le Code de Position des Déclarations (SPC), qui permet de transformer une requête SQL imbriquée en un ensemble de déclarations SELECT non imbriquées ; nous proposons également une méthode de remplissage de champs basée sur un plan (sketch-based slot filling) pour synthétiser chaque déclaration SELECT correspondant à son SPC. En outre, deux méthodes de manipulation d'entrée sont présentées afin d'améliorer davantage les performances de génération. RYANSQL atteint une précision de 58,2 % sur le défi Spider, soit une amélioration de 3,2 points de pourcentage par rapport aux approches précédemment les plus performantes. À la date de rédaction de cet article, RYANSQL figure en première position sur le classement Spider.