한 달 전

양방향 LSTM-CRF 모델을 이용한 시퀀스 태깅

Zhiheng Huang; Wei Xu; Kai Yu
양방향 LSTM-CRF 모델을 이용한 시퀀스 태깅
초록

본 논문에서는 시퀀스 태깅을 위한 다양한 Long Short-Term Memory (LSTM) 기반 모델을 제안합니다. 이 모델들은 LSTM 네트워크, 양방향 LSTM (BI-LSTM) 네트워크, Conditional Random Field (CRF) 레이어를 사용한 LSTM (LSTM-CRF), 그리고 양방향 LSTM과 CRF 레이어를 결합한 모델 (BI-LSTM-CRF)을 포함합니다. 본 연구는 처음으로 양방향 LSTM CRF (BI-LSTM-CRF로 표기) 모델을 자연어 처리(NLP) 벤치마크 시퀀스 태깅 데이터 세트에 적용하였습니다. 우리는 BI-LSTM-CRF 모델이 양방향 LSTM 구성요소 덕분에 과거와 미래의 입력 특성을 효율적으로 활용할 수 있음을 보여주었습니다. 또한 CRF 레이어 덕분에 문장 단위의 태그 정보를 활용할 수 있습니다. BI-LSTM-CRF 모델은 품사 태깅(POS), 구문 분석(chunking), 그리고 명명 실체 인식(NER) 데이터 세트에서 최고 수준의 정확도(또는 그에 가까운 정확도)를 달성할 수 있으며, 이전 관찰 결과와 비교하여 단어 임베딩에 대한 의존성이 적고 견고함을 나타냈습니다.

양방향 LSTM-CRF 모델을 이용한 시퀀스 태깅 | 최신 연구 논문 | HyperAI초신경