18일 전

샘플링이 중요하다! 검색 기반 대화 시스템에서 매칭 모델 학습을 위한 부정 샘플링 전략에 대한 실증 연구

{Chongyang Tao, Wei Wu, Rui Yan, Dongyan Zhao, Yansong Feng, Jia Li}
샘플링이 중요하다! 검색 기반 대화 시스템에서 매칭 모델 학습을 위한 부정 샘플링 전략에 대한 실증 연구
초록

검색 기반 대화 시스템에서 효과적인 모델 학습을 위해 자동으로 학습 데이터셋을 구성하기 위해 부정 예시(음성 예시)를 어떻게 샘플링할지에 대해 연구한다. 학습 과정에서 매칭 모델에 따라 부정 예시를 동적으로 적응시키는 아이디어를 따르며, 최소 샘플링, 최대 샘플링, 반경직(세미하드) 샘플링, 감쇠 하드 샘플링의 네 가지 전략을 고려한다. 세 가지 매칭 모델을 사용한 두 개의 벤치마크에서 수행한 실험 결과에 따르면, 널리 사용되는 랜덤 샘플링 전략과 비교했을 때, 첫 두 전략은 성능 저하를 초래하지만, 후두 전략은 두 벤치마크에서 모든 모델의 성능에 지속적인 향상을 가져온다.