11일 전
중국어 대화 음성에서 생략된 대명사 복원과 대화 내 논의 구조 분석을 위한 공동 모델
Jingxuan Yang, Kerui Xu, Jun Xu, Si Li, Sheng Gao, Jun Guo, Nianwen Xue, Ji-Rong Wen

초록
본 논문에서는 중국어 대화 음성에서 공동된 생략된 대명사 복원(DPR)과 대화적 담론 구조 분석(CDP)을 동시에 수행하는 신경망 모델을 제안한다. 우리는 DPR와 CDP가 서로 밀접하게 연관되어 있으며, 공동 모델을 사용할 경우 양 측면의 성능이 모두 향상됨을 보여준다. 본 모델을 DiscProReco라고 명명하며, 먼저 대화 내 각 발화의 토큰들을 방향성 그래프 컨볼루션 네트워크(GCN)를 통해 인코딩한다. 이후 각 발화의 토큰 상태를 집계하여 발화 하나당 하나의 상태 벡터를 생성한다. 이 발화 상태들은 이중선형 분류기(biaffine classifier)에 입력되어 대화적 담론 그래프를 구축한다. 이후 두 번째의 다중 관계형(GCN)을 발화 상태에 적용하여 담론 관계를 보강한 표현을 생성하고, 이를 각 발화의 토큰 상태와 결합하여 생략된 대명사 복원 층의 입력으로 사용한다. 제안된 공동 모델은 새로운 구조 구문 강화형 생략 대명사 복원(SPDP) 데이터셋을 기반으로 학습 및 평가되었으며, 해당 데이터셋은 두 가지 유형의 정보를 함께 레이블링하였다. SPDP 데이터셋 및 기타 기준 데이터셋에 대한 실험 결과를 통해 DiscProReco가 각각의 작업에서 최신 기준 모델보다 유의미하게 우수한 성능을 보였다.