PromptNER: 명시적 위치 지정 및 유형화를 위한 Named Entity Recognition

프롬프트 학습은 사전 훈련된 언어 모델을 활용하는 새로운 패러다임으로, 많은 작업에서 큰 성공을 거두었습니다. NER 작업에 프롬프트 학습을 도입하기 위해 두 가지 방법이 대칭적인 관점에서 탐구되었습니다. 하나는 스패닝(enumerating spans)을 통해 템플릿을 채우고 해당 엔티티 유형을 예측하는 것이며, 다른 하나는 엔티티를 위치시키기 위한 유형별 프롬프트를 구성하는 것입니다. 그러나 이러한 방법들은 시간과 계산 비용이 많이 드는 다단계 프롬프팅 방식을 필요로 하며, 실용적인 시나리오에서 적용하기 어려운 복잡한 프롬프트 템플릿도 요구합니다.본 논문에서는 엔티티 위치 추정과 엔티티 유형 분류를 프롬프트 학습으로 통합하고, 각각 위치 슬롯(position slot)과 유형 슬롯(type slot)으로 구성된 이중 슬롯 다중 프롬프트 템플릿을 설계하였습니다. 여러 개의 프롬프트가 모델에 동시에 입력될 수 있으며, 모델은 슬롯에서 병렬로 예측하여 모든 엔티티를 추출합니다. 훈련 중 슬롯에 라벨을 할당하기 위해, 프롬프트와 실제 엔티티 사이의 확장된 이분 그래프 매칭(extended bipartite graph matching) 메커니즘을 사용한 동적 템플릿 채움 기법을 설계하였습니다.다양한 환경에서 실험을 수행하였으며, 이에는 자원이 풍부한 평면 및 중첩 NER 데이터셋과 자원이 부족한 영역 내 및 영역 간 데이터셋이 포함되었습니다. 실험 결과, 제안된 모델은 특히 영역 간 소량 샘플 설정(cross-domain few-shot setting)에서 상당한 성능 개선을 보였으며, 최신 기술 모델보다 평균 7.7% 더 우수한 성능을 나타냈습니다.