
摘要
近年来,知识库问答(Knowledge Base Question Answering, KBQA)引起了广泛关注,尤其是在处理需要多条事实才能回答的复杂问题方面。问题分解(Question Decomposition)是应对复杂问题的一种有前景的策略。然而,现有的分解方法通常仅依据单一的组合性类型(compositionality type)将问题拆分为子问题,难以应对涉及多种组合性类型的复杂问题。为此,本文提出了一种名为“问题分解树”(Question Decomposition Tree, QDT)的新结构,用于表征复杂问题的内在结构。受自然语言生成(Natural Language Generation, NLG)领域最新进展的启发,我们提出了一种两阶段方法——Clue-Decipher,用于生成QDT。该方法能够充分利用NLG模型的强大生成能力,同时保留原始问题的语义完整性。为验证QDT在提升KBQA任务性能方面的有效性,我们设计了一种基于分解的KBQA系统,命名为QDTQA。大量实验结果表明,QDTQA在ComplexWebQuestions数据集上的表现优于以往最先进的方法。此外,我们的分解方法还将现有KBQA系统的性能提升了12%,并在LC-QuAD 1.0数据集上取得了新的最先进水平。