12일 전

의존성 분석을 위한 비지도 트리 대치 문법 유도

{Trevor Cohn, Phil Blunsom}
의존성 분석을 위한 비지도 트리 대치 문법 유도
초록

텍스트로부터 문법을 직접 유도하는 것은 계산언어학 분야에서 가장 오래되고 도전적인 과제 중 하나이다. 의존 문법 유도 분야에서는 상당한 진전이 이루어졌지만, 사용된 모델들은 특히 지도 학습 기반 파싱 모델들과 비교했을 때 지나치게 단순하다. 본 논문에서는 나무 대체 문법(Tree Substitution Grammar)을 활용한 의존 문법 유도 방법을 제안하며, 이는 대규모의 의존 구조 조각을 학습할 수 있어 텍스트를 보다 효과적으로 모델링할 수 있도록 한다. 또한, 간단한 생성 규칙을 가진 작은 문법을 선호하도록 유도하는 계층적 비모수적 피트만-요르 과정(Pitman-Yor Process) 사전 분포를 정의한다. 실험 결과, 머리 첨부 정확도(Head Attachment Accuracy)를 기준으로 기존 최고 성능 모델을 상당히 초월하는 성능을 보였다.