
摘要
我们提出了一种用于无监督依存句法分析的自训练方法,该方法重新利用了现有的监督和无监督解析算法。我们的方法称为“迭代重排序”(Iterated Reranking,简称 IR),从无监督解析器生成的依存树开始,然后通过在这些依存树上训练的监督解析中使用的更丰富的概率模型,迭代地改进这些依存树。我们的系统在 WSJ 语料库上的准确率比 Spitkovsky 等人(2013)提出的最先进解析器高出 1.8%。
我们提出了一种用于无监督依存句法分析的自训练方法,该方法重新利用了现有的监督和无监督解析算法。我们的方法称为“迭代重排序”(Iterated Reranking,简称 IR),从无监督解析器生成的依存树开始,然后通过在这些依存树上训练的监督解析中使用的更丰富的概率模型,迭代地改进这些依存树。我们的系统在 WSJ 语料库上的准确率比 Spitkovsky 等人(2013)提出的最先进解析器高出 1.8%。