
摘要
通过自然语言与关系数据库进行交互,可以帮助任何背景的用户轻松查询和分析大量数据。这需要一个系统能够理解用户的问题并自动将其转换为SQL查询。在本文中,我们提出了一种新颖的方法——TypeSQL,该方法将这一问题视为槽填充任务。此外,TypeSQL利用类型信息来更好地理解自然语言问题中的罕见实体和数字。我们在WikiSQL数据集上测试了这一想法,并在较短的时间内比之前的最先进方法提高了5.5%的性能。我们还展示了当用户的查询格式不规范时,访问数据库的内容可以显著提高性能。TypeSQL达到了82.6%的准确率,相比之前的内容敏感模型绝对提升了17.5%。