2달 전

Penn Treebank에 대한 헤드 주도 문구 구조 문법 해석

Junru Zhou; Hai Zhao
Penn Treebank에 대한 헤드 주도 문구 구조 문법 해석
초록

헤드-드리븐 문구 구조 문법(HPSG)은 풍부한 문맥적 구문론적 의미와 심지어 의미론적 의미까지 균일한 형식으로 표현하는 것을 특징으로 합니다. 본 논문에서는 구성소와 의존 관계의 형식적 표현을 헤드-드리븐 문구 구조에 통합하여 단순화된 HPSG를 제시하는 첫 시도를 수행합니다. 그런 다음, 두 가지 변환된 트리 표현인 분할 범위(division span)와 결합 범위(joint span)에 대해 각각 두 개의 파싱 알고리즘이 제안됩니다. HPSG가 구성소와 의존 구조 정보를 모두 인코딩하기 때문에, 제안된 HPSG 파서는 이 두 유형의 구조에 대한 일종의 결합 디코더로 간주될 수 있으며, 따라서 추출되거나 변환된 구성소 및 의존 관계 파싱 트리를 기준으로 평가됩니다. 우리의 파서는 Penn Treebank(PTB)와 중국 Penn Treebank에서 모두 구성소 파싱과 의존 관계 파싱 작업에 있어서 새로운 최고 성능을 달성하였습니다. 이를 통해 구성소와 의존 관계 구조의 결합 학습 효과성을 검증하였습니다. 자세히 말하면, PTB에서 구성소 파싱의 F1 점수가 96.33이고, 의존 관계 파싱의 UAS 점수가 97.20%입니다.