11일 전

이름 있는 실체 인식 작업을 위한 심층 신경망 모델

{Anh Le. Mikhail S. Burtsev}
이름 있는 실체 인식 작업을 위한 심층 신경망 모델
초록

신경 시퀀스 레이블링의 품질에 직접적이고 중요한 영향을 미치는 가장 중요한 요소 중 하나는 풍부한 의미적 및 문법적 표현 벡터를 생성하기 위해 입력 특징을 어떻게 선택하고 인코딩하느냐이다. 본 논문에서는 시퀀스 레이블링 문제 중 하나인 명명된 실체 인식(Named Entity Recognition, NER) 작업을 해결하기 위해 깊은 신경망 모델을 제안한다. 제안하는 모델은 문자 수준 및 대문자 특징을 충분히 활용하고 단어 수준의 문맥적 표현을 포함하기 위해 세 개의 하위 네트워크로 구성되어 있다. 제안 모델의 다양한 언어에 대한 일반화 능력을 입증하기 위해 러시아어, 베트남어, 영어, 중국어에서 모델을 평가하였으며, 각각 Gareev의 데이터셋, VLSP-2016, CoNLL-2003, MSRA 데이터셋에서 F-메이저가 91.10%, 94.43%, 91.22%, 92.95%로 최신 기술 수준의 성능을 달성하였다. 또한, 학습 및 개발 세트에 단 100개의 샘플만을 사용하여도 모델이 약 70%의 F1 점수를 기록하며 우수한 성능을 보였다.

이름 있는 실체 인식 작업을 위한 심층 신경망 모델 | 최신 연구 논문 | HyperAI초신경