17일 전

타입 인식 기반 분해형 프레임워크를 통한 소량 샘플 명명된 엔티티 인식

Yongqi Li, Yu Yu, Tieyun Qian
타입 인식 기반 분해형 프레임워크를 통한 소량 샘플 명명된 엔티티 인식
초록

최근 몇몇 이단계형 프로토타입 네트워크들이 소수 샘플 명명된 실체 인식(NER) 작업에서 성공을 거두었음에도 불구하고, 스팬 탐지 단계에서의 과도한 오진 스팬과 유형 분류 단계에서의 부정확하고 불안정한 프로토타입은 여전히 해결해야 할 과제로 남아 있다. 본 논문에서는 이러한 문제들을 해결하기 위해 새로운 유형 인지 분해형 프레임워크인 TadNER(Typе-Aware Decomposed NER)를 제안한다. 먼저, 유형 이름으로부터 의미적으로 멀리 떨어진 스팬을 제거함으로써 오진 스팬을 필터링하는 유형 인지 스팬 필터링 전략을 제안한다. 그 후, 지원 샘플과 유형 이름을 함께 참조로 활용하여 보다 정확하고 안정적인 프로토타입을 구축하는 유형 인지 대조 학습 전략을 제시한다. 다양한 벤치마크에서 실시한 광범위한 실험 결과, 제안하는 TadNER 프레임워크가 새로운 최고 성능(SOTA)을 달성함을 입증하였다. 본 연구의 코드와 데이터는 https://github.com/NLPWM-WHU/TadNER 에 공개될 예정이다.