
초록
신경망 기반 자연어 생성(NNLG) 시스템은 입력 사양과 무관한 텍스트를 생성하는 병리적 출력으로 잘 알려져 있다. 본 논문에서는 다양한 의미적 제어 메커니즘을 구현한 최첨단 NNLG 모델들에 대한 의미적 노이즈의 영향을 분석한다. 그 결과, 정제된 데이터를 사용할 경우 의미적 정확도를 최대 97%까지 향상시킬 수 있음을 확인하였으며, 이와 동시에 자연스러움(fluency)을 유지할 수 있음을 밝혔다. 또한 가장 흔한 오류는 환상적 생성(hallucination)이 아니라 정보 누락(omitting information)임을 발견하였다.