17 天前
ADAPT 参与 SemEval-2018 任务 9:基于跳字模型的词嵌入在专业语料库中的无监督上位词发现
{Filip Klubi{\v{c}}ka, Alfredo Maldonado}

摘要
本文介绍了一种简单但具有竞争力的无监督上下位词(hypernym)发现系统。该系统采用带有负采样的skip-gram词向量模型,并在特定领域语料库上进行训练。对于输入词语,系统基于余弦相似度得分预测其候选上下位词。我们分别在两个特定领域语料库——医学语料库和音乐产业语料库上独立训练了两组词向量模型。在与其他无监督系统对比时,该系统在医学领域表现最优,但在音乐产业领域表现较差。该系统仅依赖原始的特定领域语料库,不需任何外部数据支持。