17 天前
RAT-SQL:面向文本到SQL解析器的关系感知模式编码与链接
Bailin Wang, Richard Shin, Xiaodong Liu, Oleksandr Polozov, Matthew Richardson

摘要
在将自然语言问题转化为SQL查询以回答数据库问题时,当前的语义解析模型难以泛化到未见过的数据库模式。这一泛化挑战主要源于两个方面:(a)如何以语义解析器可访问的方式编码数据库关系;(b)如何建模数据库列与查询中相应指代之间的对齐关系。为此,我们提出了一种基于关系感知自注意力机制的统一框架,用于在文本到SQL编码器中同时解决模式编码、模式链接和特征表示问题。在具有挑战性的Spider数据集上,该框架将精确匹配准确率提升至57.2%,相比现有最优方法实现了8.7个百分点的绝对提升。进一步结合BERT进行增强后,该模型在Spider排行榜上达到了65.6%的新最优性能。此外,我们还观察到模型在理解模式链接与对齐关系方面表现出显著的定性改进。我们的代码实现将开源,地址为:https://github.com/Microsoft/rat-sql。