2 个月前

命名实体识别的神经网络架构

Guillaume Lample; Miguel Ballesteros; Sandeep Subramanian; Kazuya Kawakami; Chris Dyer
命名实体识别的神经网络架构
摘要

最先进的命名实体识别系统在学习时严重依赖手工特征和领域特定知识,尤其是在可用的小规模监督训练语料库中。本文介绍了两种新的神经架构——一种基于双向LSTM(长短期记忆网络)和条件随机场,另一种则采用受移位-归约分析器启发的基于转换的方法来构建和标记片段。我们的模型依赖于关于词语的两个信息来源:从监督语料库中学到的基于字符的词表示和从未标注语料库中学到的无监督词表示。这两种模型在四种语言的命名实体识别任务中取得了最先进的性能,而无需借助任何特定语言的知识或资源,如地名词典。

命名实体识别的神经网络架构 | 最新论文 | HyperAI超神经