
초록
다중의도 음성 언어 이해(SLU, Spoken Language Understanding)는 SLU의 새로운이고 더 복잡한 시나리오로, 점점 더 많은 주목을 받고 있다. 기존의 SLU와 달리, 이 시나리오에서 각 의도(intent)는 특정 범위(scope)를 갖는다. 범위 외의 의미 정보는 오히려 의도 예측을 방해하므로, 의도 탐지의 난이도가 크게 증가한다. 더욱 심각한 문제는, 정확하지 않은 의도 레이블을 기반으로 슬롯 채우기(slot filling)를 유도할 경우 오류 전파(error propagation) 문제가 발생하여 전반적인 성능이 만족스럽지 못해진다는 점이다. 이러한 과제를 해결하기 위해 본 논문에서는 Transformer 기반의 새로운 스코프 감지 결과 주의망(Scope-Sensitive Result Attention Network, SSRAN)을 제안한다. 이 모델은 스코프 인식기(Scope Recognizer, SR)와 결과 주의망(Result Attention Network, RAN)으로 구성된다. 스코프 인식기는 각 토큰에 스코프 정보를 할당함으로써 범위 외 토큰의 방해를 줄인다. 결과 주의망은 슬롯 채우기와 의도 탐지의 결과 간 양방향 상호작용을 효과적으로 활용하여 오류 전파 문제를 완화한다. 두 개의 공개 데이터셋에 대한 실험 결과, 제안 모델은 최첨단 기준 모델 대비 전반적인 정확도에서 각각 5.4%와 2.1% 향상시키며 SLU 성능을 크게 개선함을 입증하였다.