HyperAI

초록

긴 엔티티 언급 내에 포함된 엔티티 언급은 중첩 엔티티(nested entities)라고 한다. 대부분의 명명된 엔티티 인식(NER) 시스템은 평면적 엔티티(flattened entities)만 다루며 내부의 중첩된 엔티티는 무시하기 때문에, 텍스트 내에 포함된 더 세밀한 의미 정보를 포착하지 못한다. 이 문제를 해결하기 위해 우리는 평면적 NER 레이어를 동적으로 스택하여 중첩 엔티티를 식별하는 새로운 신경망 모델을 제안한다. 각 평면적 NER 레이어는 최신 기술 기반의 평면적 NER 모델에 기반하며, 양방향 Long Short-Term Memory(LSTM) 레이어를 통해 순차적 맥락 표현을 추출하고, 이를 연쇄적(CRF) 레이어에 입력한다. 제안 모델은 현재 평면적 NER 레이어의 LSTM 레이어 출력을 병합하여 탐지된 엔티티에 대한 새로운 표현을 구성하고, 이를 다음 평면적 NER 레이어에 입력한다. 이를 통해 모델은 내부 엔티티에 인코딩된 정보를 최대한 활용하여, 내부에서 외부로(inside-to-outside) 방향으로 외부 엔티티를 추출할 수 있다. 본 모델은 더 이상 외부 엔티티가 추출되지 않을 때까지 평면적 NER 레이어를 동적으로 스택한다. 광범위한 평가 결과, 제안 모델은 중첩 NER 문제에서 최신의 특징 기반 시스템들을 초월하며, GENIA 및 ACE2005 데이터셋에서 각각 F-스코어 74.7%와 72.2%를 달성하였다.

벤치마크	방법론	지표
named-entity-recognition-on-ace-2005	Neural layered model	F1: 72.2
named-entity-recognition-on-genia	Neural layered model	F1: 74.7
nested-mention-recognition-on-ace-2005	Neural layered model	F1: 72.2
nested-named-entity-recognition-on-ace-2005	Neural layered model	F1: 72.2
nested-named-entity-recognition-on-genia	Neural layered model	F1: 74.7

벤치마크

방법론

지표

named-entity-recognition-on-ace-2005

Neural layered model

F1: 72.2

named-entity-recognition-on-genia

Neural layered model

F1: 74.7

nested-mention-recognition-on-ace-2005

Neural layered model

F1: 72.2