2달 전

Merge and Label: 중첩 NER를 위한 새로운 신경망 구조

Joseph Fisher; Andreas Vlachos
Merge and Label: 중첩 NER를 위한 새로운 신경망 구조
초록

명시된 개체 인식(Named Entity Recognition, NER)은 자연어 처리 분야에서 가장 많이 연구된 작업 중 하나입니다. 그러나 대부분의 접근 방식은 많은 응용 프로그램에서 흔히 볼 수 있는 중첩 구조를 처리할 수 없습니다. 본 논문에서는 새로운 신경망 아키텍처를 소개합니다. 이 아키텍처는 먼저 토큰과/또는 개체를 중첩 구조로 형성되는 개체로 합치고, 그 다음 각각을 독립적으로 라벨링하는 방식을 취합니다. 기존 연구와 달리, 우리의 합치기 및 라벨링 접근 방식은 이산적인 분할 구조가 아닌 실수 값을 예측하여, 단어와 중첩 개체 임베딩을 결합하면서 미분 가능성을 유지할 수 있습니다. %여러 단계에 걸쳐 개체를 단일 벡터로 부드럽게 그룹화합니다. 우리는 ACE 2005 코퍼스를 사용하여 우리의 접근 방식을 평가하였으며, 이는 최신 기술(F1 점수 74.6)을 달성하였습니다. 또한 문맥 임베딩(BERT)을 활용하면 F1 점수가 82.4까지 향상되어, 같은 데이터로 훈련된 기존 접근 방식 대비 약 8 F1 포인트의 전반적인 성능 향상을 보였습니다. 또한 우리는 이를 평면 NER 구조에 대한 주요 접근 방식인 BiLSTM-CRF와 비교하여, 중첩 구조 예측 능력이 간단한 경우의 성능에 영향을 미치지 않는다는 것을 입증하였습니다.

Merge and Label: 중첩 NER를 위한 새로운 신경망 구조 | 최신 연구 논문 | HyperAI초신경