2달 전

대화 응답 선택을 위한 계층적 커리큘럼 학습

Yixuan Su; Deng Cai; Qingyu Zhou; Zibo Lin; Simon Baker; Yunbo Cao; Shuming Shi; Nigel Collier; Yan Wang
대화 응답 선택을 위한 계층적 커리큘럼 학습
초록

우리는 대화 응답 선택을 위한 매칭 모델의 학습을 연구합니다. 최근 무작위 부정 샘플로 훈련된 모델이 실제 환경에서 이상적이지 않다는 연구 결과에 착안하여, 우리는 "쉬움에서 어려움" 방식으로 매칭 모델을 훈련시키는 계층적 커리큘럼 학습 프레임워크를 제안합니다. 우리의 학습 프레임워크는 두 가지 보완적인 커리큘럼으로 구성됩니다: (1) 코퍼스 수준의 커리큘럼(CC); (2) 인스턴스 수준의 커리큘럼(IC). CC에서는 모델이 대화 맥락과 응답 후보 사이의 매칭 단서를 찾는 능력을 점차적으로 향상시킵니다. IC에서는 대화 맥락과 응답 후보 사이의 불일치 정보를 식별하는 모델의 능력을 점진적으로 강화합니다. 세 개의 벤치마크 데이터셋과 세 개의 최신 매칭 모델을 사용한 실증 연구 결과, 제안된 학습 프레임워크가 다양한 평가 지표에서 모델 성능을 크게 향상시키는 것을 확인할 수 있었습니다.