17일 전

명사 인식을 통한 의존성 구문 분석

Juntao Yu, Bernd Bohnet, Massimo Poesio
명사 인식을 통한 의존성 구문 분석
초록

명사 인식(Named Entity Recognition, NER)은 자연어 처리에서 기본적인 과제로, 텍스트 내에서 실체(entity)를 나타내는 구간을 식별하는 것을 목표로 한다. 기존의 NER 연구는 주로 평면적 실체(Flat NER)에 국한되어 있으며, 예를 들어 [은행 of [중국]]과 같이 실체 참조가 중첩될 수 있다는 사실을 간과해 왔다(Finkel과 Manning, 2009). 본 논문에서는 그래프 기반 의존성 파싱의 아이디어를 활용하여, 이중선형 모델(biaffine model, Dozat과 Manning, 2017)을 통해 입력 문장에 대한 전역적 시각을 모델에 제공한다. 이 이중선형 모델은 문장 내 시작 토큰과 끝 토큰의 쌍에 대해 점수를 부여함으로써 모든 가능한 구간을 탐색할 수 있도록 하여, 모델이 명사 실체를 정확하게 예측할 수 있도록 한다. 우리는 8개의 코퍼스에 대한 평가를 통해 이 모델이 중첩형 NER와 평면형 NER 모두에 대해 우수한 성능을 발휘함을 보이며, 모든 데이터셋에서 최고 수준의 성능(SoTA)을 달성했으며, 정확도 측면에서 최대 2.2퍼센트포인트의 향상을 기록했다.

명사 인식을 통한 의존성 구문 분석 | 최신 연구 논문 | HyperAI초신경