11 天前

基于部分观测TreeCRF的嵌套命名实体识别

Yao Fu, Chuanqi Tan, Mosha Chen, Songfang Huang, Fei Huang
基于部分观测TreeCRF的嵌套命名实体识别
摘要

命名实体识别(Named Entity Recognition, NER)是自然语言处理领域中一个被广泛研究的任务。然而,当前广泛采用的序列标注框架在识别具有嵌套结构的实体时存在困难。本文将嵌套式NER视为带有部分观测树结构的短语结构解析问题,并采用部分观测树条件随机场(Partially-Observed TreeCRFs)进行建模。具体而言,我们将所有标注的实体跨度视为短语结构树中的可观测节点,其余未标注的跨度则视为潜在节点。通过引入TreeCRF,我们能够以统一的方式联合建模可观测节点与潜在节点。为计算部分观测树的概率,本文提出一种改进的Inside算法——Masked Inside算法。该算法支持对不同节点执行不同的推理操作:对可观测节点进行评估,对潜在节点进行边缘化处理,对与可观测信息不兼容的节点进行拒绝处理。该算法具备高效的并行化实现,显著提升了训练与推理速度。实验结果表明,所提出的方法在ACE2004和ACE2005数据集上均取得了当前最优(SOTA)的F1分数,且在GENIA数据集上的表现与现有SOTA模型相当。相关代码已开源,地址为:https://github.com/FranxYao/Partially-Observed-TreeCRFs。

基于部分观测TreeCRF的嵌套命名实体识别 | 最新论文 | HyperAI超神经