
초록
우리는 중국어 명사 인식(NER)을 위한 격자 구조의 LSTM 모델을 연구합니다. 이 모델은 입력 문자 시퀀스뿐만 아니라 사전과 일치하는 모든 잠재적인 단어를 인코딩합니다. 문자 기반 방법과 비교할 때, 우리의 모델은 명시적으로 단어와 단어 시퀀스 정보를 활용합니다. 단어 기반 방법과 비교할 때, 격자 LSTM은 분절 오류에 영향을 받지 않습니다. 게이트 반복 셀은 우리 모델이 문장에서 가장 관련성이 높은 문자와 단어를 선택하여 더 나은 NER 결과를 얻도록 합니다. 다양한 데이터셋에 대한 실험 결과, 격자 LSTM이 단어 기반 및 문자 기반 LSTM 베이스라인보다 우수한 성능을 보임을 확인할 수 있으며, 최상의 결과를 달성하였습니다.