2달 전

BoningKnife: Prior Boundary Knowledge을 활용한 중첩 NER를 위한 통합된 실체 인식 및 타이핑

Huiqiang Jiang; Guoxin Wang; Weile Chen; Chengxi Zhang; Börje F. Karlsson
BoningKnife: Prior Boundary Knowledge을 활용한 중첩 NER를 위한 통합된 실체 인식 및 타이핑
초록

명명된 개체 인식(Named Entity Recognition, NER)은 자연어 처리의 핵심적인 작업이지만, 대부분의 접근 방식은 중첩 구조를 무시하고 평면적 개체만을 대상으로 합니다. 이는 많은 시나리오에서 흔히 볼 수 있는 중첩 구조를 고려하지 않는다는 점에서 문제가 됩니다. 기존의 대부분 중첩 NER 방법들은 모든 부분 시퀀스를 순회하여 비용이 많이 들고 효율적이지 않으며, 중첩 개체에 중요한 경계 지식을 충분히 고려하지 못합니다.본 논문에서는 사전 경계 지식(Prior Boundary Knowledge)을 활용한 중첩 NER 추출 및 인식 작업을 더 잘 처리하기 위한 공동 개체 언급 탐지 및 유형화 모델(BoningKnife)을 제안합니다. BoningKnife는 MentionTagger와 TypeClassifier 두 가지 모듈로 구성됩니다. MentionTagger는 단순히 개체의 시작/종료 위치뿐만 아니라 경계 지식을 더 잘 활용하여 중첩 레벨과 긴 범위를 처리하는 능력을 향상시키며, 고품질의 언급 후보를 생성합니다. TypeClassifier는 두 단계 주의 메커니즘(Two-level Attention Mechanism)을 사용하여 서로 다른 중첩 레벨 표현을 분리하고 개체 유형을 더 잘 구별할 수 있습니다.우리는 공통 표현과 새로운 듀얼 정보 주의 층(Dual-info Attention Layer)을 공유하면서 두 모듈을 공동으로 훈련시킵니다. 이는 개체 관련 정보에 대한 표현 집중도를 향상시키는데 기여합니다. 다양한 데이터셋에 대한 실험 결과, 우리의 접근 방식이 이전 최신 방법들을 능가하며, ACE2004, ACE2005, NNE에서 각각 86.41, 85.46, 94.2 F1 점수를 달성했습니다.

BoningKnife: Prior Boundary Knowledge을 활용한 중첩 NER를 위한 통합된 실체 인식 및 타이핑 | 최신 연구 논문 | HyperAI초신경