2달 전

Sequence-to-Nuggets: Anchor-Region Networks을 이용한 중첩된 개체 언급 감지

Hongyu Lin; Yaojie Lu; Xianpei Han; Le Sun
Sequence-to-Nuggets: Anchor-Region Networks을 이용한 중첩된 개체 언급 감지
초록

시퀀스 라벨링 기반의 명명된 실체 인식(NER) 접근 방식은 각 단어가 최대 하나의 실체 언급에만 속하도록 제한하기 때문에 중첩된 실체 언급을 인식할 때 심각한 문제에 직면하게 됩니다. 본 논문에서는 이러한 문제를 해결하기 위해 실체 언급의 헤드 주도 구조를 모델링하고 활용하는 방법을 제안합니다. 즉, 언급이 다른 언급을 포함할 수 있지만 동일한 헤드 단어를 공유하지는 않는다는 점입니다. 구체적으로, 우리는 중첩된 언급 검출을 위한 시퀀스-투-누겟(sequence-to-nuggets) 아키텍처인 앵커-리전 네트워크(Anchor-Region Networks, ARNs)를 제안합니다. ARNs는 먼저 모든 언급의 앵커 단어(즉, 가능한 헤드 단어)를 식별하고, 규칙적인 구조를 활용하여 각 앵커 단어의 언급 경계를 인식합니다. 또한, 우리는 앵커 단어 주석 없이 ARNs를 엔드-투-엔드 방식으로 학습할 수 있는 목적 함수인 백 로스(Bag Loss)도 설계하였습니다. 실험 결과, ARNs는 세 가지 표준 중첩된 실체 언급 검출 벤치마크에서 최고 성능을 달성함을 보여주었습니다.

Sequence-to-Nuggets: Anchor-Region Networks을 이용한 중첩된 개체 언급 감지 | 최신 연구 논문 | HyperAI초신경