2달 전

야생에서의 담화 일관성: 데이터셋, 평가 및 방법

Alice Lai; Joel Tetreault
야생에서의 담화 일관성: 데이터셋, 평가 및 방법
초록

지금까지 실제 데이터에서 담화 일관성 방법을 평가하는 연구는 매우 적었습니다. 이를 해결하기 위해, 우리는 새로운 실제 텍스트 코퍼스(GCDC)를 소개하며, 선도적인 담화 일관성 알고리즘에 대한 첫 번째 대규모 평가 결과를 제시합니다. 본 연구에서는 신경망 모델, 특히 여기서 소개하는 두 가지 모델(SentAvg와 ParSeq)이 가장 우수한 성능을 보임을 확인하였습니다. 우리는 이러한 성능 차이를 분석하고, 네 개의 영역에서 관찰된 저일관성 텍스트의 패턴에 대해 논의합니다.