11일 전
테이블 텍스트 생성을 위한 인코더 개선을 위한 보조 감독 작업
{Dayong Hu, Yinliang Yue, Can Ma, Liang Li}

초록
표 텍스트 생성은 표 내의 주요 정보를 쉽게 얻을 수 있도록 자연어 텍스트를 자동으로 생성하는 것을 목표로 한다. 신경망 기반의 표 텍스트 생성 모델은 상당한 발전을 이뤘지만, 여전히 일부 문제들이 간과되고 있다. 기존의 방법들은 엔티티(선수 또는 팀)의 성과와 엔티티 간의 관계로부터 사실적 결과를 도출하는 데 한계가 있다. 이 문제를 해결하기 위해 우리는 입력된 표로부터 엔티티 그래프를 먼저 구축하고, 그래프 상에서 추론을 수행할 수 있는 추론 모듈을 도입한다. 또한, 서로 다른 차원의 레코드들 사이에는 다양한 관계(예: 수치 크기 관계, 중요도 관계 등)가 존재하며, 이러한 관계는 데이터에서 텍스트를 생성하는 데 기여할 수 있다. 그러나 일반적인 인코더 모델은 이러한 관계를 효과적으로 포착하기 어렵다. 따라서 우리는 인코더가 이러한 다양한 관계를 잘 학습할 수 있도록 보조 작업 두 가지인 수치 순위 지정(Number Ranking, NR)과 중요도 순위 지정(Importance Ranking, IR)을 도입하여 학습을 지도한다. ROTOWIRE 및 RW-FG 데이터셋에서의 실험 결과, 제안하는 방법은 우수한 일반화 능력을 보이며, BLEU, 콘텐츠 선택(Content Selection), 콘텐츠 순서(Content Ordering) 등의 여러 지표에서 기존 방법들을 능가함을 확인할 수 있었다.