
摘要
近年来,上下文相关的文本到SQL语义解析技术——即在交互过程中将自然语言转化为SQL查询——引起了广泛关注。以往的研究通常仅利用交互历史中的话语信息或先前预测的SQL查询作为上下文依赖信息,但未能同时有效融合这两类信息,其主要原因在于自然语言与逻辑形式的SQL之间存在语义鸿沟。针对这一问题,本文提出一种历史信息增强的文本到SQL模型(HIE-SQL),旨在同时利用历史话语和上一轮预测的SQL查询中的上下文依赖信息。为缓解自然语言与SQL之间的语义不匹配问题,我们将其视为两种模态,并提出一种双模态预训练模型,以弥合两者之间的差距。此外,我们设计了一种模式链接图(schema-linking graph),以增强话语与SQL查询到数据库模式之间的关联性。实验结果表明,所提出的基于历史信息增强的方法显著提升了HIE-SQL的性能,在撰写本文时,该模型在两个典型的上下文相关文本到SQL基准数据集——SparC和CoSQL上均取得了新的最先进(state-of-the-art)结果。