11일 전

다양한 당사자 대화 내역 구문 분석 개선을 위한 도메인 통합

Zhengyuan Liu, Nancy F. Chen
다양한 당사자 대화 내역 구문 분석 개선을 위한 도메인 통합
초록

다자 대화는 일반적으로 독백이나 문서보다 구조가 덜 명확하지만, 상호작용하는 각 대화 단계 간의 의미 수준 상관관계에 의해 암묵적으로 조직되어 있다. 이에 따라 대화 논의 분석(dialogue discourse analysis)을 적용하여 기본 논의 단위 간의 종속 구조와 관계를 예측할 수 있으며, 후속 작업에 대한 풍부한 구조 정보를 제공할 수 있다. 그러나 현재 존재하는 대화 논의 주석이 붙은 코퍼스는 특정 도메인에서 수집된 것으로 표본 크기가 제한적이며, 도메인 적응 없이 새로운 대화에 적용할 경우 데이터 기반 접근법의 성능이 낮은 편이다. 본 논문에서는 먼저 Transformer 기반의 파서를 제안하고, 이의 도메인 간 전이 성능을 평가한다. 그 다음, 데이터 및 언어 모델링 측면에서 세 가지 방법을 도입하여 도메인 통합을 도모함으로써 일반화 능력을 향상시킨다. 실증 결과에 따르면, 제안하는 방법들을 통해 신경망 파서가 성능 향상을 얻으며, 도메인 간 대화 샘플에 대해 더 우수한 성능을 발휘함을 확인할 수 있었다.

다양한 당사자 대화 내역 구문 분석 개선을 위한 도메인 통합 | 최신 연구 논문 | HyperAI초신경