
초록
본 연구는 일본어 단어 분할(Japanese Word Segmentation, JWS)을 위한 장단기 기억(Long Short-Term Memory, LSTM) 신경망 접근법을 제시합니다. 이전의 중국어 단어 분할(Chinese Word Segmentation, CWS) 연구에서는 LSTM 및 게이트 순환 유닛(gated recurrent units, GRU)과 같은 순환 신경망을 사용하여 성공적인 결과를 얻었습니다. 그러나 중국어와 달리 일본어는 히라가나, 가타카나, 한자 등 여러 문자 유형을 포함하고 있어 표기상의 변동성을 초래하고 단어 분할의 어려움을 증가시키는 특징이 있습니다. 또한 JWS 작업에서는 전역적 맥락을 고려하는 것이 중요하지만, 기존의 JWS 접근법은 주로 국지적 특징에 의존해 왔습니다. 이러한 문제를 해결하기 위해 본 연구에서는 LSTM 기반 접근법을 활용하는 방안을 제안합니다. 실험 결과, 제안된 모델은 다양한 일본어 말뭉치에 대해 최고 수준의 정확도를 달성함을 보여주었습니다.