17일 전

이름 있는 실체 인식을 위한 더 나은 특징 통합

Lu Xu, Zhanming Jie, Wei Lu, Lidong Bing
이름 있는 실체 인식을 위한 더 나은 특징 통합
초록

의존성 트리에 의해 포착된 장거리 구조 정보를 Named Entity Recognition(NER)에 통합할 경우 성능 향상이 가능하다는 것이 입증되었다. 우리는 이러한 현상이 선형 시퀀스에 의해 포착되는 맥락 정보와 의존성 트리에 의해 포착되는 구조 정보 간의 상호보완적 관계 때문이라고 생각한다. 그러나 기존의 접근 방식들은 주로 LSTM과 그래프 신경망(GNN), 예를 들어 그래프 컨볼루션 네트워크(GCN)를 겹쳐서 사용하여 개선된 NER 모델을 구축하는 데 집중해 왔다. 이 방식에서는 두 유형의 특징 간의 정확한 상호작용 메커니즘이 명확하지 않고, 성능 향상도 상당히 제한적인 것으로 나타났다. 본 연구에서는 Synergized-LSTM(Syn-LSTM)을 제안함으로써 두 유형의 특징을 간단하고 강건하게 통합하는 해결책을 제시한다. Syn-LSTM은 두 가지 특징 간의 상호작용 방식을 명확히 포착할 수 있다. 우리는 네 가지 언어에 걸쳐 여러 표준 데이터셋에서 광범위한 실험을 수행하였다. 결과적으로 제안된 모델은 이전의 접근 방식보다 더 뛰어난 성능을 달성하면서도 파라미터 수가 적은 것으로 나타났다. 추가적인 분석을 통해 본 모델이 강력한 기준 모델들에 비해 더 긴 거리의 의존성을 효과적으로 포착할 수 있음을 확인하였다.