11일 전

단어의 의미 해석에 대한 신경 시퀀스 학습 모델

{ro, Claudio Delli Bovi, Roberto Navigli, Aless Raganato}
단어의 의미 해석에 대한 신경 시퀀스 학습 모델
초록

의미 맥락 해석(Word Sense Disambiguation) 모델은 다양한 형태로 존재한다. 비록 지도학습 기반 모델이 정확도 측면에서 가장 뛰어난 성능을 보이지만, 특정 의미 맥락 해석 대상에 대해 단어 전문가가 각각 학습을 수행해야 하는 점에서, 더 유연한 지식 기반 접근 방식에 비해 경쟁력이 떨어지는 경우가 많다. 이러한 격차를 극복하기 위해 우리는 새로운 관점을 도입하여 시퀀스 학습(sequence learning)을 활용해 의미 맥락 해석 문제를 재정의한다. 본 연구에서는 양방향 Long Short-Term Memory(LSTM)부터 인코더-디코더 구조에 이르기까지, 작업에 직접적으로 맞춤형으로 설계된 일련의 엔드투엔드(end-to-end) 신경망 아키텍처를 제안하고 심층적으로 분석한다. 표준 벤치마크에서 다양한 언어로 수행된 광범위한 평가를 통해, 시퀀스 학습이 모든 단어를 대상으로 하는 보다 유연한 모델을 가능하게 하며, 엔지니어링된 특징을 가진 단어 전문가 모델과 비교해도 일관되게 최첨단 성능을 달성함을 확인하였다.

단어의 의미 해석에 대한 신경 시퀀스 학습 모델 | 최신 연구 논문 | HyperAI초신경