
초록
대부분의 비지도 의존 구문 분석기들은 주어진 문장과 그 구문 구조의 공동 분포를 학습하는 확률적 생성 모델에 기반하고 있다. 이러한 확률적 생성 모델은 일반적으로 원하는 의존 구문 트리를 인수화된 문법 규칙으로 명시적으로 분해하기 때문에, 전체 문장의 전역적 특징을 반영하지 못하는 한계가 있다. 본 논문에서는 문장과 그 구문을 연속적인 잠재 표현에서 생성하는 새로운 확률적 모델인 ‘가치를 고려한 판별적 신경 의존 모델(Discriminative Neural Dependency Model with Valence, D-NDMV)’을 제안한다. 이 잠재 표현은 생성된 문장의 전역적 맥락 정보를 인코딩한다. 우리는 잠재 표현을 모델링하기 위해 두 가지 접근 방식을 제안한다. 첫 번째는 문장을 기반으로 잠재 표현을 결정론적으로 요약하는 방식이며, 두 번째는 문장을 조건으로 하여 잠재 표현을 확률적으로 모델링하는 방식이다. 본 연구의 접근법은 생성적 기법과 판별적 기법의 장점을 결합한 새로운 유형의 오토인코더 모델로 간주할 수 있으며, 특히 이전의 생성적 접근법에서 고수해온 문맥 자유 독립성 가정을 깨뜨림으로써 더 높은 표현력을 갖게 된다. 다양한 출처의 17개 데이터셋에 대한 광범위한 실험 결과를 통해, 본 방법은 생성적 및 판별적 최신 비지도 의존 구문 분석기들과 비교해 경쟁적인 정확도를 달성함을 확인하였다.