
摘要
超标记(Supertagging)通常被视为组合范畴语法(Combinatory Categorical Grammar, CCG)解析中的一个重要任务,其中上下文信息的有效建模对于该任务至关重要。然而,现有的研究在利用上下文特征方面所做的努力有限,除了应用强大的编码器(如双向长短期记忆网络(bi-LSTM))。本文提出了一种基于注意力机制的图卷积网络(Attentive Graph Convolutional Networks),通过一种新颖的方法来利用上下文信息,从而增强神经CCG超标记。具体而言,我们从词汇表中提取短语片段(n-grams)构建图,并在图上应用注意力机制,使得来自不同上下文的词对在模型中被赋予不同的权重,从而有助于超标记任务的进行。实验结果表明,在CCGbank数据集上的测试显示,我们的方法在超标记和解析两个方面均优于所有先前的研究。进一步的分析说明了我们方法中每个组件的有效性,这些组件能够有选择地从词对中学习以增强CCG超标记的效果。