7일 전
외부 컨텍스트 검색 및 협업 학습을 통한 명명된 엔터티 인식 개선
Xinyu Wang, Yong Jiang, Nguyen Bach, Tao Wang, Zhongqiang Huang, Fei Huang, Kewei Tu

초록
최근 Named Entity Recognition (NER) 분야의 발전은 문서 수준의 문맥이 모델 성능을 크게 향상시킬 수 있음을 보여주고 있다. 그러나 많은 응용 시나리오에서는 이러한 문맥 정보를 활용할 수 없다. 본 논문에서는 검색 엔진을 통해 원문 문장을 쿼리로 사용하여 의미적으로 관련성이 높은 텍스트들을 검색하고 선택함으로써 문장의 외부 문맥을 탐색하는 방법을 제안한다. 실험적으로, 문장과 그 외부 문맥을 연결하여 구성한 검색 기반 입력 보기에서 계산된 문맥 표현은 단순히 문장 자체만을 기반으로 한 원래 입력 보기보다 훨씬 우수한 성능을 달성함을 확인하였다. 더불어, 두 입력 보기 간의 문맥 표현 또는 출력 레이블 분포가 유사하도록 유도하는 협업 학습(Concurrent Learning)이라는 학습 방법을 활용함으로써, 두 입력 보기 모두의 모델 성능을 더욱 향상시킬 수 있다. 실험 결과, 본 방법은 5개 도메인에 걸쳐 8개의 NER 데이터셋에서 새로운 최고 성능(SOTA)을 달성함을 입증하였다.