2달 전

Bidirectional LSTM-CNNs를 이용한 명시 인식

Jason P.C. Chiu; Eric Nichols
Bidirectional LSTM-CNNs를 이용한 명시 인식
초록

명시 인식은 전통적으로 높은 성능을 달성하기 위해 대량의 지식, 즉 특징 공학과 사전(lexicons) 형태로 많은 정보가 필요했던 어려운 작업입니다. 본 논문에서는 하이브리드 양방향 LSTM 및 CNN 구조를 사용하여 단어 수준과 문자 수준의 특징을 자동으로 감지하는 새로운 신경망 아키텍처를 제시합니다. 이는 대부분의 특징 공학이 필요 없게 합니다. 또한 우리는 신경망에서 부분 사전 일치를 인코딩하는 새로운 방법을 제안하고 기존 접근 방식과 비교합니다. 광범위한 평가 결과, 토큰화된 텍스트와 공개적으로 이용 가능한 단어 임베딩만 주어진 상태에서 우리의 시스템은 CoNLL-2003 데이터셋에서 경쟁력을 보이며, OntoNotes 5.0 데이터셋에서는 기존에 보고된 최신 성능보다 2.13 F1 점수를 뛰어넘었습니다. 공개적으로 이용 가능한 출처에서 구성된 두 개의 사전을 사용함으로써, 우리는 CoNLL-2003에서 F1 점수가 91.62, OntoNotes에서 86.28로 새로운 최신 성능을 확립하였으며, 이는 중점적인 특징 공학, 독점적 사전, 그리고 풍부한 엔티티 링킹 정보를 활용하는 시스템들을 능가하였습니다.