Command Palette
Search for a command to run...
T5-SR : Une Stratégie Unifiée de Décodage Seq-to-Seq pour la Paraphrase Sémantique
T5-SR : Une Stratégie Unifiée de Décodage Seq-to-Seq pour la Paraphrase Sémantique
Yuntao Li Zhenpeng Su Yutian Li Hanchu Zhang Sirui Wang Wei Wu Yan Zhang
Résumé
La traduction des requêtes en langage naturel en requêtes SQL selon une approche seq2seq a récemment suscité un intérêt croissant. Toutefois, par rapport à la génération de SQL basée sur des arbres syntaxiques abstraits, les parseurs sématiques seq2seq font face à des défis bien plus importants, notamment une qualité médiocre dans la prédiction des informations sur le schéma et une faible cohérence sémantique entre les requêtes en langage naturel et les requêtes SQL correspondantes. Ce papier analyse ces difficultés et propose une stratégie de décodage orientée seq2seq, appelée SR, qui comporte une nouvelle représentation intermédiaire, nommée SSQL, ainsi qu'une méthode de reranking utilisant un ré-estimateur de score pour surmonter respectivement ces obstacles. Les résultats expérimentaux démontrent l'efficacité des techniques proposées, et T5-SR-3b atteint de nouveaux résultats de pointe sur le jeu de données Spider.