11일 전

신경망 기반 자연어 생성에서 의미적 노이즈의 중요성

Ondřej Dušek, David M. Howcroft, Verena Rieser
신경망 기반 자연어 생성에서 의미적 노이즈의 중요성
초록

신경망 기반 자연어 생성(NNLG) 시스템은 입력 사양과 무관한 텍스트를 생성하는 병리적 출력으로 잘 알려져 있다. 본 논문에서는 다양한 의미적 제어 메커니즘을 구현한 최첨단 NNLG 모델들에 대한 의미적 노이즈의 영향을 분석한다. 그 결과, 정제된 데이터를 사용할 경우 의미적 정확도를 최대 97%까지 향상시킬 수 있음을 확인하였으며, 이와 동시에 자연스러움(fluency)을 유지할 수 있음을 밝혔다. 또한 가장 흔한 오류는 환상적 생성(hallucination)이 아니라 정보 누락(omitting information)임을 발견하였다.

신경망 기반 자연어 생성에서 의미적 노이즈의 중요성 | 최신 연구 논문 | HyperAI초신경