2달 전

RST 파싱부터 시작하기

Thanh-Tung Nguyen; Xuan-Phi Nguyen; Shafiq Joty; Xiaoli Li
RST 파싱부터 시작하기
초록

우리는 문장 수준의 담화 분석을 위한 새로운 상향식(Top-Down) 종단간(End-to-End) 공식화를 소개합니다. 이 공식화는 담화 구조 이론(Rhetorical Structure Theory, RST) 프레임워크에서 제시되며, 토큰 경계에서의 분할 결정 시퀀스로 담화 분석을 고려하고 seq2seq 네트워크를 사용하여 분할 결정을 모델링합니다. 우리의 프레임워크는 담화 세분화를 사전 요구사항으로 필요로 하지 않고, 대신 파싱 과정의 일부로서 세분화를 생성합니다. 우리의 통합된 파싱 모델은 빔 검색(beam search)을 채택하여 높은 점수를 받은 트리 공간을 탐색하여 최상의 트리 구조를 디코딩합니다. 표준 영어 RST 담화 트리뱅크에 대한 광범위한 실험을 통해 우리 파서가 금자루 세분화(gold segmentation)와 함께 종단간 파싱에서 기존 방법보다 크게 우수함을 입증하였습니다. 더욱 중요한 것은, 이 모든 것이 수작업 특징(handcrafted features)을 사용하지 않고 이루어진다는 것입니다. 이로 인해 우리 파서는 더 빠르고 새로운 언어와 영역에 쉽게 적응할 수 있습니다.