17일 전

SemEval-2018 Task 9에서의 ADAPT: 전문 코퍼스 내 비지도 하이퍼니움 탐지에 활용된 스킵그램 단어 임베딩

{Filip Klubi{\v{c}}ka, Alfredo Maldonado}
SemEval-2018 Task 9에서의 ADAPT: 전문 코퍼스 내 비지도 하이퍼니움 탐지에 활용된 스킵그램 단어 임베딩
초록

이 논문은 초의어(하이퍼니움) 탐색을 위한 간단하면서도 경쟁력 있는 비지도 학습 시스템을 제시한다. 이 시스템은 특화된 코퍼스 위에서 훈련된 음성어 임베딩(스킵그램 + 음성 샘플링)을 사용하며, 입력 단어에 대한 후보 초의어는 코사인 유사도 점수를 기반으로 예측한다. 두 가지 특화된 코퍼스—의료 분야 코퍼스와 음악 산업 코퍼스—각각에 대해 독립적으로 두 세트의 단어 임베딩 모델을 훈련시켰다. 제안하는 시스템은 의료 분야에서 경쟁하는 비지도 시스템 중 가장 높은 성능을 기록했으나, 음악 산업 분야에서는 성능이 저조했다. 본 시스템은 원시의 특화된 코퍼스 외에 외부 데이터에 의존하지 않는다.