
초록
명사 인식(Named Entity Recognition, NER)은 자연어 처리에서 기본적인 과제로, 텍스트 내에서 실체(entity)를 나타내는 구간을 식별하는 것을 목표로 한다. 기존의 NER 연구는 주로 평면적 실체(Flat NER)에 국한되어 있으며, 예를 들어 [은행 of [중국]]과 같이 실체 참조가 중첩될 수 있다는 사실을 간과해 왔다(Finkel과 Manning, 2009). 본 논문에서는 그래프 기반 의존성 파싱의 아이디어를 활용하여, 이중선형 모델(biaffine model, Dozat과 Manning, 2017)을 통해 입력 문장에 대한 전역적 시각을 모델에 제공한다. 이 이중선형 모델은 문장 내 시작 토큰과 끝 토큰의 쌍에 대해 점수를 부여함으로써 모든 가능한 구간을 탐색할 수 있도록 하여, 모델이 명사 실체를 정확하게 예측할 수 있도록 한다. 우리는 8개의 코퍼스에 대한 평가를 통해 이 모델이 중첩형 NER와 평면형 NER 모두에 대해 우수한 성능을 발휘함을 보이며, 모든 데이터셋에서 최고 수준의 성능(SoTA)을 달성했으며, 정확도 측면에서 최대 2.2퍼센트포인트의 향상을 기록했다.