CAN-NER: Chinese Named Entity Recognition을 위한 Convolutional Attention Network

중국어의 고유 명사 인식(Named Entity Recognition, NER)은 필수적이지만 자연적인 구분자(l natural delimiters)가 부족하여 어려움이 따릅니다. 따라서 중국어 단어 분할(Chinese Word Segmentation, CWS)은 일반적으로 중국어 NER의 첫 번째 단계로 간주됩니다. 그러나 단어 수준의 임베딩(word-level embeddings)과 사전 기능(lexicon features)을 기반으로 하는 모델들은 종종 분할 오류(segmentation errors)와 사전에 없는 단어(out-of-vocabulary, OOV words) 문제를 겪습니다. 본 논문에서는 중국어 NER를 위한 합성곱 주의망(Convolutional Attention Network, CAN)을 조사합니다. 이 모델은 인접한 문자들에서 정보를 추출하는 문자 기반 합성곱 신경망(character-based convolutional neural network, CNN)과 문장 맥락(sentence contexts)에서 정보를 추출하는 게이트 순환 유닛(gated recurrent unit, GRU)을 포함하며, 전역 자기 주의(global self-attention layer) 층을 통해 두 구성 요소가 결합됩니다. 또한 다른 모델들과 비교하여 사전 등의 외부 자원에 의존하지 않고 작은 크기의 문자 임베딩(char embeddings)을 사용함으로써 우리의 모델은 더욱 실용적입니다. 광범위한 실험 결과는 우리 접근 방식이 웨이보(Weibo), MSRA 및 중국어 이력서 NER 데이터셋 등 다양한 도메인 데이터셋에서 단어 임베딩이나 외부 사전 자원 없이 최신 방법론(state-of-the-art methods)보다 우수한 성능을 보임을 입증하였습니다.