17일 전
SemEval-2018 Task 10에서의 UWB: 단어 분포로부터 구분 가능한 특성 추출
{Tom{\'a}{\v{s}} Hercig, Tom{\'a}{\v{s}} Brychc{\'\i}n, Michal Konkol, Josef Steinberger}

초록
우리는 SemEval 2018에서 분별 가능한 특성 추출 작업을 위한 UWB 시스템을 제안한다. 주어진 두 단어와 하나의 특성에 대해, 해당 특성이 두 단어 사이에서 분별 가능한지 여부를 판단한다. 분포 가설(Distributional Hypothesis)을 전제로 하여, 단어의 의미는 문맥 내 분포와 관련이 있다는 가정 하에, 단어의 문맥 정보를 비교하기 위한 여러 접근 방식을 제안한다. 최신의 의미 공간(semantic spaces)과 간단한 동시 등장 통계(co-occurrence statistics)를 활용한 실험을 수행하였다. 그 결과, 문장집합(corpus) 내 단어의 분포가 분별 가능한 특성을 탐지하는 데 유용한 잠재력을 지닌다는 것을 입증하였다. 본 시스템은 F1 점수 72.1%를 기록하며, 총 26개 제출 시스템 중 4위를 차지하였다.