2달 전

다중 해상도 명명된 실체 인식

Congying Xia; Chenwei Zhang; Tao Yang; Yaliang Li; Nan Du; Xian Wu; Wei Fan; Fenglong Ma; Philip Yu
다중 해상도 명명된 실체 인식
초록

본 논문은 다중 세분화된 명명된 개체 인식(Multi-Grained Named Entity Recognition)을 위한 새로운 프레임워크인 MGNER를 제시합니다. 이 프레임워크는 문장 내에서 여러 개체 또는 개체 언급이 중첩되지 않거나 완전히 중첩될 수 있는 경우를 처리할 수 있습니다. 전통적인 접근 방식이 NER을 시퀀스 라벨링 작업으로 간주하고 개체를 연속적으로 주석화하는 것과 달리, MGNER는 다양한 세분화 단위에서 개체를 감지하고 인식합니다. 즉, 비중첩적 구조나 완전히 중첩된 구조를 명시적으로 가정하지 않고도 명명된 개체를 인식할 수 있습니다. MGNER는 모든 가능한 단어 구간을 검사하는 Detector와 개체를 분류하는 Classifier로 구성됩니다. 또한, 이 프레임워크는 전체 과정에서 문맥 정보와 자기 주의 메커니즘(self-attention mechanism)을 활용하여 NER 성능을 향상시키고 있습니다. 실험 결과, MGNER는 중첩/비중첩 NER 작업에서 F1 점수 기준으로 최신 최고 기준 모델들보다 최대 4.4% 우수한 성능을 보였습니다.

다중 해상도 명명된 실체 인식 | 최신 연구 논문 | HyperAI초신경