
摘要
我们提出了CALM,一种协调结构分析器,用于改进依赖句法分析所识别出的并列成分。该方法基于语言模型进行评分,并结合多种语言学约束,对嵌套式并列结构的层级并列边界进行搜索。通过在这些并列成分处对复合句进行切分,CALM可输出多个简单句。我们在开放信息抽取(Open IE)这一最终任务中验证了该协调分析器的有效性。当前最先进的Open IE系统由于对并列句处理效率低下,导致抽取结果显著减少。我们提出的Open IE系统CALMIE,基于CALM识别出的简单句进行信息抽取,在抽取量上相较原始句子的抽取结果最高提升1.8倍,同时仅带来适度的精度下降。