2달 전

End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF 두 방향 LSTM-CNNs-CRF를 활용한 단일 과정 시퀀스 라벨링

Xuezhe Ma; Eduard Hovy
End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF
두 방향 LSTM-CNNs-CRF를 활용한 단일 과정 시퀀스 라벨링
초록

최신 시퀀스 라벨링 시스템은 전통적으로 작업 특유의 지식을 수작업으로 생성된 특성과 데이터 사전 처리 형태로 대량으로 필요로 합니다. 본 논문에서는 양방향 LSTM, CNN 및 CRF를 결합하여 단어 수준과 문자 수준 표현을 자동으로 활용하는 새로운 신경망 아키텍처를 소개합니다. 우리의 시스템은 진정한 엔드투엔드 방식으로, 특성 공학이나 데이터 사전 처리가 필요하지 않으므로 다양한 시퀀스 라벨링 작업에 적용할 수 있습니다. 우리는 이 시스템을 두 가지 시퀀스 라벨링 작업을 위한 두 개의 데이터 세트에서 평가했습니다 --- 품사 태깅(Part-of-Speech tagging)을 위한 Penn Treebank WSJ 코퍼스와 명명된 실체 인식(Named Entity Recognition)을 위한 CoNLL 2003 코퍼스입니다. 우리는 두 데이터 세트 모두에서 최고 성능을 달성했습니다 --- 품사 태깅의 정확도는 97.55%, 명명된 실체 인식의 F1 점수는 91.21%입니다.

End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF 두 방향 LSTM-CNNs-CRF를 활용한 단일 과정 시퀀스 라벨링 | 최신 연구 논문 | HyperAI초신경