16일 전

Few-shot 자연어 생성을 통한 작업 지향 대화

Baolin Peng, Chenguang Zhu, Chunyuan Li, Xiujun Li, Jinchao Li, Michael Zeng, Jianfeng Gao
Few-shot 자연어 생성을 통한 작업 지향 대화
초록

업무 지향 대화 시스템의 핵심 구성 요소인 자연어 생성(Natural Language Generation, NLG) 모듈은 의미적 형태로 표현된 대화 행위(dialog act)를 자연어 응답으로 변환한다. 기존의 템플릿 기반 또는 통계 기반 모델의 성공은 풍부한 레이블링 데이터에 크게 의존하며, 이는 새로운 도메인에 대해 실현 가능하지 않다. 따라서 실용적 응용에서 제한된 레이블 데이터로도 잘 일반화할 수 있는 NLG 시스템의 구현이 매우 중요하다. 이를 위해 우리는 업무 지향 대화 시스템에서 소수의 학습 예시(few-shot learning) 설정을 시뮬레이션할 수 있는 최초의 NLG 벤치마크인 FewShotWoz를 제안한다. 또한, 대규모 레이블링된 NLG 코퍼스를 사전 훈련하여 제어 가능한 생성 능력을 습득하고, 새로운 도메인에 적응하기 위해 소수의 도메인 특화 레이블만으로 미세 조정(fine-tuning)이 가능한 SC-GPT 모델을 개발하였다. FewShotWoz 및 대규모 Multi-Domain-WOZ 데이터셋에서의 실험 결과, 다양한 자동 평가 지표와 인간 평가를 통해 제안하는 SC-GPT가 기존 방법들을 상회함을 확인할 수 있었다.

Few-shot 자연어 생성을 통한 작업 지향 대화 | 최신 연구 논문 | HyperAI초신경