1 个月前

双向LSTM-CRF模型用于序列标注

Zhiheng Huang; Wei Xu; Kai Yu
双向LSTM-CRF模型用于序列标注
摘要

在本文中,我们提出了一系列基于长短期记忆网络(LSTM)的序列标注模型。这些模型包括LSTM网络、双向LSTM(BI-LSTM)网络、带有条件随机场(CRF)层的LSTM网络(LSTM-CRF)以及带有CRF层的双向LSTM网络(BI-LSTM-CRF)。我们的研究首次将双向LSTM条件随机场模型(记作BI-LSTM-CRF)应用于自然语言处理基准序列标注数据集。我们展示了该模型由于具备双向LSTM组件,能够高效利用过去和未来的输入特征;同时,由于CRF层的存在,它还能够利用句子级别的标签信息。实验结果表明,BI-LSTM-CRF模型在词性标注(POS)、分块(chunking)和命名实体识别(NER)数据集上能够达到或接近当前最佳的准确率。此外,该模型具有较强的鲁棒性,并且对词嵌入的依赖程度较低,这与之前的观察结果相比有所改进。

双向LSTM-CRF模型用于序列标注 | 最新论文 | HyperAI超神经