18 天前

SemEval-2018任务9中的EXPR:一种用于上位词发现的综合方法

{Nicolas B{\'e}chet, Ahmad Issa Alaa Aldine, Mounira Harzallah, Giuseppe Berio, Ahmad Faour}
SemEval-2018任务9中的EXPR:一种用于上位词发现的综合方法
摘要

在本文中,我们提出了名为 EXPR 的系统,用于参与 SemEval 2018 的上位词发现任务。该任务旨在从文本语料库中识别上位词关系。我们的方法结合了基于路径的策略与分布语义策略。首先,利用依存句法分析器对语料库进行分析,提取候选上位词,并将其依存路径表示为特征向量。随后,将该特征向量与通过 Wikipedia 预训练词嵌入模型获得的特征向量进行拼接。拼接后的特征向量输入至监督式机器学习模型,用于训练分类器。该分类器能够对新的候选上位词进行判断,识别其是否为真正的上位词。实验结果表明,本系统在发现未包含在标准上位词集合(gold hypernyms)中的新上位词方面表现优异。