한 달 전

스케일 가능한 신경 대화 상태 추적 모델로의 접근

Elnaz Nouri; Ehsan Hosseini-Asl
스케일 가능한 신경 대화 상태 추적 모델로의 접근
초록

현재의 신경망 기반 대화 상태 추적 모델에서 지연(latency)은 이들이 생산 시스템에 효율적으로 배포되는 것을 방해하고 있습니다. 이 논문에서는 최근 Zhong 등이 제안한 Global-Local Self-Attention (GLAD) 모델을 기반으로 한 새로운 확장성과 정확성을 갖춘 신경망 대화 상태 추적 모델을 제안합니다. GLAD 모델은 다양한 유형(대화 상태의 슬롯(slots)이라고 불림)의 추정기 간에 매개변수를 공유하기 위해 전역(global) 모듈을 사용하고, 슬롯별 특징(slot-specific features)을 학습하기 위해 국소(local) 모듈을 사용합니다. 제안된 모델은 GLAD 모델에서 사용되는 (1 + 슬롯 수) 개의 전역 및 국소 조건부 재귀 네트워크와 달리 단 하나의 전역 조건부 재귀 네트워크만 사용하여, 평균적으로 훈련 및 추론 시간의 지연을 35% 줄였습니다. 또한, 턴 요청 성능은 97.38%, 공동 목표 및 정확도는 88.51%로 유지되었습니다. 다중 도메인 데이터셋(Multi-domain dataset, Multi-WoZ)에서의 평가 결과도 제안된 모델이 GLAD보다 턴 정보 제공과 공동 목표 정확도에서 우수함을 보여주었습니다.

스케일 가능한 신경 대화 상태 추적 모델로의 접근 | 최신 연구 논문 | HyperAI초신경