Command Palette
Search for a command to run...
SADGA : Réseau d’agrégation de graphes dual sensible à la structure pour le texte vers SQL
SADGA : Réseau d’agrégation de graphes dual sensible à la structure pour le texte vers SQL
Ruichu Cai Jinjie Yuan Boyan Xu Zhifeng Hao
Résumé
La tâche de Text-to-SQL, visant à traduire les questions formulées en langage naturel en requêtes SQL, suscite un intérêt croissant ces dernièrement. L’un des problèmes les plus complexes de cette tâche réside dans la capacité du modèle entraîné à généraliser à des schémas de bases de données inédits, également connu sous le nom de tâche cross-domain Text-to-SQL. Le point clé réside dans la capacité de généralisation de (i) la méthode d’encodage utilisée pour modéliser la question et le schéma de base de données, ainsi que de (ii) la méthode d’association entre question et schéma, permettant d’apprendre les correspondances entre les mots de la question et les tables ou colonnes du schéma de base de données. En nous concentrant sur ces deux enjeux fondamentaux, nous proposons un réseau d’agrégation graphique dual sensible à la structure (SADGA) pour la tâche cross-domain Text-to-SQL. Dans SADGA, nous utilisons une structure de graphe afin de proposer un modèle d’encodage unifié pour à la fois la question en langage naturel et le schéma de base de données. À partir de cette modélisation unifiée, nous introduisons par la suite une méthode d’agrégation sensible à la structure, conçue pour apprendre la correspondance entre le graphe-question et le graphe-schéma. Cette méthode repose sur trois composantes principales : l’association globale entre graphes, l’association locale entre graphes et un mécanisme d’agrégation dual entre graphes. Nous évaluons empiriquement les performances de notre approche, et obtenons, au moment de la rédaction de cet article, la troisième place sur le benchmark exigeant Text-to-SQL Spider.