
초록
이 논문은 중첩 명명된 엔티티 인식(Nested Named Entity Recognition, Nested NER)을 위한 새로운 계층적 모델인 Pyramid을 제안한다. 본 연구에서 우리는 토큰 또는 텍스트 영역의 임베딩을 하단에서 상단으로 향해 L개의 평면적 NER 계층에 반복적으로 입력하며, 피라미드 형태로 쌓아 올린다. 각 계층을 통과할 때마다 임베딩의 길이는 하나씩 감소한다. 계층 l에서의 은닉 상태는 입력 텍스트 내의 l-그램을 나타내며, 해당 텍스트 영역이 완전한 엔티티 언급을 나타내는 경우에만 레이블이 부여된다. 또한, 계층 간 양방향 상호작용을 가능하게 하기 위해 역피라미드 구조를 설계하였다. 제안된 방법은 ACE-2004, ACE-2005, GENIA, NNE 데이터셋에서 기존의 최고 성능을 기록하며, 전통적인 임베딩을 사용했을 때 각각 80.27, 79.42, 77.78, 93.70의 F1 점수를 달성하였으며, 사전 훈련된 컨텍스트 기반 임베딩을 사용했을 경우 87.74, 86.34, 79.31, 94.68의 F1 점수를 기록하였다. 또한 본 모델은 더 일반적인 중복 명명된 엔티티 인식(Overlapping Named Entity Recognition) 문제에도 활용 가능하다. 초기 실험을 통해 본 방법이 중복 NER 문제에서 효과적임을 확인하였다.