7일 전

시퀀스-투-시퀀스 접근법을 통한 대화 상태 추적

Yue Feng, Yang Wang, Hang Li
시퀀스-투-시퀀스 접근법을 통한 대화 상태 추적
초록

이 논문은 업무 지향 대화 시스템에서 대화 상태 추적(dialogue state tracking, DST)에 대해 다룬다. 최근 상당한 진전이 있었음에도 불구하고, 매우 효과적인 DST 모듈을 구축하는 것은 여전히 도전적인 과제이다. 본 논문은 새로운 DST 접근 방식인 Seq2Seq-DU를 제안하며, 이는 DST를 시퀀스에서 시퀀스로의 문제로 형식화한다. Seq2Seq-DU는 대화 내 발화를 각각 인코딩하기 위해 두 개의 BERT 기반 인코더를 사용하며, 발화 임베딩과 스키마 임베딩 간의 주의(attention)를 계산하기 위한 어텐셔너(attender)와 현재 대화 상태를 나타내는 포인터를 생성하기 위한 디코더를 포함한다. Seq2Seq-DU는 다음과 같은 장점을 갖는다. 먼저, 의도(intent), 슬롯(slot), 슬롯 값(slot value)을 동시에 모델링할 수 있다. 둘째, BERT 기반의 � бог rich한 표현을 활용하여 발화와 스키마의 표현을 효과적으로 활용할 수 있다. 셋째, 범주형 및 비범주형 슬롯뿐 아니라 미리 보지 못한 스키마에 대해서도 효과적으로 대응할 수 있다. 또한 Seq2Seq-DU는 대화 시스템의 NLU(Natural Language Understanding) 모듈에서도 활용 가능하다. 다양한 설정(SGD, MultiWOZ2.2, MultiWOZ2.1, WOZ2.0, DSTC2, M2M, SNIPS, ATIS)에서의 벤치마크 데이터셋에 대한 실험 결과를 통해, Seq2Seq-DU가 기존 방법들을 모두 초월함을 확인할 수 있었다.

시퀀스-투-시퀀스 접근법을 통한 대화 상태 추적 | 최신 연구 논문 | HyperAI초신경