7일 전

확장 가능한 신경망 대화 상태 추적

Vevake Balaraman, Bernardo Magnini
확장 가능한 신경망 대화 상태 추적
초록

대화 상태 추적기(DST)는 각 대화 턴에서 사용자의 가능한 목표에 대한 믿음( beliefs )을 추정하는 것을 목표로 하는 대화 시스템의 핵심 구성 요소이다. 현재 대부분의 DST 추적기는 순환 신경망(Recurrent Neural Networks)을 활용하며, 도메인 온톨로지에 정의된 슬롯-값 쌍, 사용자 발화, 시스템 행동 등 대화의 여러 측면을 처리하는 복잡한 아키텍처에 기반하고 있다. 그러나 이러한 신경망 아키텍처의 복잡성은 대화 상태 예측에 상당한 지연(latency)을 초래하며, 특히 작업의 확장성(즉, 슬롯 수)이 중요한 요소인 실세계 응용 분야에 모델을 도입하는 데 제약을 초래한다. 본 논문에서는 매우 낮은 지연 시간으로 대화 상태를 예측할 수 있으면서도 높은 성능을 유지하는 혁신적인 신경망 모델인 '글로벌 인코더와 슬롯 집중형 디코더(G-SAT, Global encoder and Slot-Attentive decoders)'를 제안한다. 우리는 WoZ2.0 데이터셋의 세 가지 언어(영어, 이탈리아어, 독일어)에 대해 실험을 수행하였으며, 제안된 방법이 기존 최고 수준의 DST 시스템과 비교해 정확도와 예측 시간 복잡도 측면에서 경쟁력을 갖추고 있음을 보여주었다. 특히, 다른 시스템보다 예측 속도가 15배 이상 빠르다는 점에서 뛰어난 성능을 입증하였다.

확장 가능한 신경망 대화 상태 추적 | 최신 연구 논문 | HyperAI초신경