18 天前

基于单个神经网络的序列对齐集成用于序列标注

{SungRyeol Kim, Hyuk Namgung, Hyein Seo, SangKeun Jung, Jeesu Jung}
摘要

序列标注是一种在自然语言处理中具有基础性意义的任务,其目标是对输入序列中的每个词元(token)依次赋予一个类别或标签。近年来,众多先进的神经网络架构被提出以解决序列标注问题。相比之下,针对序列集成(sequential ensemble)问题的研究则相对较少。本文通过在所提出的集成框架中引入序列对齐方法,有效解决了序列集成问题。具体而言,我们提出了一种简单而高效的集成候选生成框架,仅需一个神经序列标注网络即可便捷地构建多个异构系统。为验证该框架的有效性,我们在词性标注(POS tagging)和依存标签预测任务上进行了实验。结果表明,在Penn Treebank词性标注数据集和通用依存标注数据集上,所提框架的准确率分别比硬投票(hard-voting)方法提升了0.19和0.33个百分点。