11일 전
데이터에서 텍스트 생성을 위한 계층적 모델
Clément Rebuffel, Laure Soulier, Geoffrey Scoutheeten, Patrick Gallinari

초록
구조화된 데이터를 자연어 설명으로 변환하는 작업은 '데이터 텍스트 생성(Data-to-Text)'이라 불리는 도전적인 과제로 부상하고 있다. 이러한 구조는 일반적으로 여러 요소와 그 속성을 함께 묶는 형태를 취한다. 기존의 대부분의 접근법은 요소들을 시퀀스로 선형화하는 번역형 인코더-디코더 방식을 사용한다. 그러나 이러한 방법은 데이터 내부에 담긴 구조적 정보의 대부분을 상실하게 된다. 본 연구에서는 요소 수준과 구조 수준에서 데이터 구조를 동시에 인코딩하는 계층적 모델을 제안함으로써 이 한계를 극복하고자 한다. RotoWire 데이터셋을 대상으로 수행한 평가 결과, 제안하는 모델이 정성적 및 정량적 지표 모두에서 우수한 성능을 보임을 확인할 수 있었다.