11일 전

다양한 도메인을 위한 엔드투엔드 작업 지향 대화를 위한 동적 융합 네트워크

Libo Qin, Xiao Xu, Wanxiang Che, Yue Zhang, Ting Liu
다양한 도메인을 위한 엔드투엔드 작업 지향 대화를 위한 동적 융합 네트워크
초록

최근 연구들은 엔드투엔드 작업 지향 대화 시스템에서 놀라운 성과를 거두었다. 그러나 대부분의 신경망 모델은 대량의 훈련 데이터에 의존하며, 이러한 데이터는 탐색 및 일정 예약과 같은 특정 작업 도메인에서만 가용하다. 이로 인해 레이블이 제한된 새로운 도메인에 대해 확장하기 어렵다는 문제가 발생한다. 특히, 모든 도메인의 데이터를 효과적으로 활용하여 각 도메인 및 미리 보지 못한 도메인의 성능을 향상시키는 방법에 대한 연구는 상대적으로 부족한 실정이다. 이를 해결하기 위해, 우리는 도메인 지식을 명시적으로 활용할 수 있는 방법을 탐구하고, 공유 지식과 특정 지식을 동시에 학습할 수 있는 공유-개별 네트워크(shared-private network)를 제안한다. 또한, 목표 도메인과 각 도메인 간의 관련성을 자동으로 탐지하여 효율적으로 통합하는 새로운 동적 융합 네트워크(Dynamic Fusion Network, DF-Net)를 제안한다. 실험 결과, 제안하는 모델은 다중 도메인 대화 시스템에서 기존 방법들을 능가하며, 문헌상 최고의 성능을 달성하였다. 더불어, 제한된 훈련 데이터 하에서도 기존 최고 성능 모델보다 평균적으로 13.9% 높은 성능을 보여, 뛰어난 전이 가능성(transferability)을 입증하였다.

다양한 도메인을 위한 엔드투엔드 작업 지향 대화를 위한 동적 융합 네트워크 | 최신 연구 논문 | HyperAI초신경