2달 전
세상은 이진이 아니다: 대화 응답 선택을 위한 그레이스케일 데이터를 이용한 순위 학습
Zibo Lin; Deng Cai; Yan Wang; Xiaojiang Liu; Hai-Tao Zheng; Shuming Shi

초록
응답 선택은 검색 기반 대화 시스템을 구축하는 데 중요한 역할을 합니다. 응답 선택이 본질적으로 순위 학습 문제임에도 불구하고, 대부분의 이전 연구에서는 점수별 관점(point-wise view)을 취하여 이 작업에 대한 이진 분류기를 훈련시켰습니다: 각 응답 후보는 관련(1) 또는 비관련(0)으로 레이블이 지정됩니다. 한편으로는, 이러한 형식화는 응답 품질의 다양성을 무시하기 때문에 최적화되지 않을 수 있습니다. 다른 한편으로는, 순위 학습을 위한 그레이스케일 데이터를 주석화하는 것은 매우 비싸고 어려울 수 있습니다. 본 연구에서는 인간의 노력 없이 자동으로 그레이스케일 데이터를 구성할 수 있음을 보입니다. 우리의 방법은 오프더셀프 응답 검색 모델과 응답 생성 모델을 사용하여 자동 그레이스케일 데이터 생성기를 활용합니다. 구성된 그레이스케일 데이터를 통해, 우리는 (1) 매칭 모델이 더 세밀한 맥락-응답 관련성 차이를 포착하도록 가르치고 (2) 방해자(distractor) 강도 측면에서 훈련-테스트 불일치를 줄이는 다단계 순위 목표를 제안합니다. 우리의 방법은 간단하고 효과적이며 보편적입니다. 세 개의 벤치마크 데이터셋과 네 개의 최신 매칭 모델에 대한 실험 결과, 제안된 접근법이 성능에 유의미하고 일관된 개선을 가져오는 것을 확인할 수 있었습니다.