
초록
대화는 본질적으로 일대다(One-to-Many) 속성을 가지고 있으며, 이는 동일한 대화 맥락에 대해 여러 응답이 적절할 수 있음을 의미합니다. 과제 지향형 대화에서 이러한 속성은 과제 완료를 위한 다양한 유효한 대화 정책을 초래합니다. 그러나 기존의 과제 지향형 대화 생성 접근 방식 중 어느 것도 이 속성을 고려하지 않습니다. 우리는 일대다 속성을 활용하여 다양하고 적절한 대화 응답을 생성하기 위한 다중 액션 데이터 증강(Multi-Action Data Augmentation, MADA) 프레임워크를 제안합니다. 구체적으로, 먼저 대화 상태를 사용하여 대화 역사의 요약을 만들고, 그 다음 각 대화 상태에서 다른 유효한 시스템 액션으로의 모든 가능한 매핑을 발견합니다. 대화 시스템 학습 과정에서, 우리는 이전 단계에서 발견된 모든 유효한 시스템 액션으로 현재 대화 상태가 매핑될 수 있도록 하여 추가적인 상태-액션 쌍을 생성합니다. 이러한 추가적인 쌍들을 통합함으로써, 대화 정책은 균형 잡힌 액션 분포를 학습하며, 이는 다시금 대화 모델이 다양하고 적절한 응답을 생성하도록 안내합니다. 실험 결과는 제안된 프레임워크가 일관되게 대화 정책의 다양성을 개선하며, 응답의 다양성과 적절성을 향상시킨다는 것을 보여줍니다. 우리의 모델은 MultiWOZ에서 최신 연구 결과(state-of-the-art)를 달성하였습니다.