2 个月前

基于实体投影的跨语言命名实体识别机器翻译方法

Alankar Jain; Bhargavi Paranjape; Zachary C. Lipton
基于实体投影的跨语言命名实体识别机器翻译方法
摘要

尽管目前已有超过100种语言得到了强大的现成机器翻译系统的支持,但其中只有少数语言拥有大规模的命名实体识别注释语料库。基于这一事实,我们利用机器翻译来改进跨语言命名实体识别中的注释投影方法。我们提出了一种系统,该系统通过以下方式改进了先前的实体投影方法:(a) 两次利用机器翻译系统:首先用于翻译句子,然后用于翻译实体;(b) 基于正字法和音系相似性匹配实体;(c) 根据从数据集中得出的分布统计信息识别匹配项。我们的方法在5种不同的语言上平均提高了4.1个百分点,超越了当前跨语言命名实体识别领域的最先进方法。此外,我们的方法在亚美尼亚语上的F_1分数达到了最先进水平,甚至超过了使用亚美尼亚语源数据训练的单语模型。

基于实体投影的跨语言命名实体识别机器翻译方法 | 最新论文 | HyperAI超神经