2달 전
저자원 네임드 엔티티 인식을 위한 강건하고 도메인 적응형 접근법
Houjin Yu; Xian-Ling Mao; Zewen Chi; Wei Wei; Heyan Huang

초록
최근, 제한된 주석 데이터를 사용하여 신뢰할 수 있는 명명된 개체 인식(NER) 시스템을 구축하는 것이 많은 관심을 받고 있습니다. 기존의 대부분 연구는 외부 사전 및 지식베이스와 같은 도메인 특화 자원에 크게 의존하고 있습니다. 그러나 이러한 도메인 특화 자원은 종종 이용할 수 없으며, 자원을 구축하는 것은 어려우면서 비용이 많이 들기 때문에, 이는 더 넓은 채택의 주요 장애물이 되고 있습니다. 이 문제를 해결하기 위해 본 연구에서는 저자원 NER를 위한 새로운 강건하고 도메인 적응형 접근 방식인 RDANER를 제안합니다. 이 접근 방식은 값싸고 쉽게 얻을 수 있는 자원만을 사용합니다. 세 가지 벤치마크 데이터셋에서 수행한 광범위한 실험 결과, 우리의 접근 방식이 값싸고 쉽게 얻을 수 있는 자원만 사용해도 최상의 성능을 달성하며, 어렵게 얻을 수 있는 도메인 특화 자원을 사용하는 최신 방법들과 경쟁력 있는 결과를 보여주었습니다. 모든 코드와 말뭉치는 https://github.com/houking-can/RDANER에서 확인할 수 있습니다.