2달 전

중국어 NER에서 사전 사용 단순화

Ruotian Ma; Minlong Peng; Qi Zhang; Xuanjing Huang
중국어 NER에서 사전 사용 단순화
초록

최근 많은 연구들이 단어 사전을 사용하여 중국어 명명된 개체 인식(NER)의 성능을 향상시키는 데 주력하고 있습니다. 이 중 대표적으로 Lattice-LSTM (장과 양, 2018)은 여러 공개 중국어 NER 데이터셋에서 새로운 기준 결과를 달성하였습니다. 그러나 Lattice-LSTM은 복잡한 모델 구조를 가지고 있어, 실시간 NER 응답이 필요한 많은 산업 분야에서의 적용에 제약을 초래합니다.본 연구에서는 단순하면서도 효과적인 방법을 제안하여 단어 사전 정보를 문자 표현에 통합합니다. 이 방법은 복잡한 시퀀스 모델링 구조 설계를 피할 수 있으며, 어떤 신경망 NER 모델이라도 문자 표현 층의 미세 조정만으로 사전 정보를 도입할 수 있습니다. 네 개의 기준 중국어 NER 데이터셋에 대한 실험 연구 결과, 제안된 방법이 최신 기술보다 최대 6.15배 빠른 추론 속도와 더 나은 성능을 보임을 확인할 수 있었습니다. 또한 실험 결과는 제안된 방법이 BERT와 같은 사전 학습 모델과 쉽게 통합될 수 있음을 보여주고 있습니다.

중국어 NER에서 사전 사용 단순화 | 최신 연구 논문 | HyperAI초신경