11일 전

데이터 텍스트 생성에서 희귀 항목 다루기

{Claire Gardent, Anastasia Shimorina}
데이터 텍스트 생성에서 희귀 항목 다루기
초록

데이터에서 텍스트 생성을 위한 신경망적 접근 방식은 일반적으로 드문 입력 항목을 처리하기 위해 탈lexical화(delexicalisation) 또는 복사 메커니즘(copy mechanism)을 사용한다. 본 연구에서는 두 데이터셋(E2E 및 WebNLG)과 두 가지 평가 설정을 활용하여 이러한 두 가지 방법의 상대적 영향을 조사한다. 본 연구는 다음 사항을 보여준다. (i) 드문 항목은 성능에 크게 영향을 미친다; (ii) 탈lexical화와 복사 메커니즘을 결합하는 것이 가장 큰 성능 향상을 가져온다; (iii) 드문 항목 및 미관측 항목에 대해서는 복사 메커니즘이 성능이 떨어진다; (iv) 이러한 두 메커니즘의 영향은 데이터셋의 구성 방식과 훈련, 검증, 테스트 데이터로의 분할 방식에 따라 크게 달라진다.

데이터 텍스트 생성에서 희귀 항목 다루기 | 최신 연구 논문 | HyperAI초신경