2달 전
반감독형 신경 모델을 이용한 단어 의미 분석
Dayu Yuan; Julian Richardson; Ryan Doherty; Colin Evans; Eric Altendorf

초록
텍스트에서 단어의 의도된 의미를 결정하는 것 - 단어 의미 구분(WSD, Word Sense Disambiguation) -은 자연어 처리 분야에서 오랜 기간 동안 해결해야 하는 문제였습니다. 최근 연구자들은 신경망 언어 모델에서 추출한 단어 벡터를 WSD 알고리즘의 특성으로 사용하여 유망한 결과를 보여주었습니다. 그러나 텍스트 내 각 단어에 대한 단순 평균이나 연결(concatenation)을 사용하면 텍스트의 순차적 및 문법적 정보가 손실됩니다. 본 논문에서는 LSTM(Long Short-Term Memory)을 활용한 시퀀스 학습 신경망을 통해 텍스트의 순차적 및 문법적 패턴을 더 잘 포착할 수 있는 WSD 방법론을 연구합니다. 모든 단어 WSD에서 훈련 데이터 부족 문제를 완화하기 위해, 우리는 반감독(semi-supervised) 라벨 전파 분류기에서 같은 LSTM을 사용합니다. 특히 동사에 대해 최신 기술 수준의 결과를 보임으로써 이를 입증하였습니다.