2달 전

슬롯은 한 번의 발화로 만들어지지 않는다: 하위 슬롯을 가진 구어체 대화

Sai Zhang; Yuwei Hu; Yuchuan Wu; Jiaman Wu; Yongbin Li; Jian Sun; Caixia Yuan; Xiaojie Wang
슬롯은 한 번의 발화로 만들어지지 않는다: 하위 슬롯을 가진 구어체 대화
초록

대화에서 슬롯 값은 특히 전화번호와 이름과 같은 중요한 정보의 경우 여러 차례에 걸쳐 단계별로 제공될 수 있습니다. 이는 일상생활에서 흔히 볼 수 있는 현상이지만, 이전 연구에서는 거의 주목받지 않았습니다. 이러한 간극을 메우기 위해 본 논문은 하위 슬롯 기반 업무 지향 대화(Sub-Slot based Task-Oriented Dialog, SSTOD)라는 새로운 작업을 정의하고, SSTOD 연구를 촉진하기 위해 중국어 대화 데이터셋 SSD를 구축하였습니다. 이 데이터셋은 중국 이름, 전화번호, 신분증 번호 및 차량 번호판 번호 등 네 가지 다른 영역에서 4만 개의 대화와 50만 개의 발화를 포함하고 있습니다. 데이터는 하위 슬롯 값, 슬롯 값, 대화 상태 및 행동으로 잘 주석이 달려 있습니다. 우리는 SSTOD에서 새로운 언어학적 현상과 상호작용 방식을 발견하였으며, 이를 처리하는 대화 에이전트 구축에 중요한 도전 과제가 됩니다. 우리는 세 가지 최신 대화 모델을 SSTOD에서 테스트하였으나, 네 가지 영역 중 어느 것에서도 제대로 처리하지 못하는 것으로 나타났�습니다. 또한 플러그인 방식으로 슬롯 지식을 포함한 개선된 모델도 조사하였습니다. 실제 응용 프로그램에서 광범위하게 존재하는 SSTOD가 제기하는 새로운 도전 과제를 해결하기 위해서는 더 많은 연구가 필요합니다. 데이터셋과 코드는 https://github.com/shunjiu/SSTOD를 통해 공개적으로 이용할 수 있습니다.