
초록
본 논문에서는 단순하면서도 효과적인 단어 의미 구분 모델을 제시합니다. 우리의 접근 방식은 모든 단어 간에 공유되는 양방향 장단기 기억망(Bidirectional Long Short-Term Memory Network)을 활용합니다. 이는 모델이 통계적 강점을 공유하고 어휘 크기에 따라 잘 확장될 수 있게 합니다. 모델은 원시 텍스트에서 의미 라벨까지 직접적으로 end-to-end로 훈련되며, 단어 순서를 효과적으로 활용합니다. 우리는 동일한 하이퍼파라미터 설정을 사용하여 두 개의 표준 데이터셋에서 접근 방식을 평가하였으며, 이 하이퍼파라미터 설정은 세 번째 별도의 검증 데이터셋에서 조정되었습니다. 우리는 외부 자원(예: 지식 그래프, 품사 태깅 등), 언어 특화 기능, 또는 수작업으로 작성된 규칙 등을 사용하지 않았음에도 불구하고, 이러한 제약 없이 최고 수준의 기존 시스템들과 통계적으로 유사한 결과를 달성하였습니다.