2달 전

깊은 정렬 클러스터링을 이용한 새로운 의도 발견

Hanlei Zhang; Hua Xu; Ting-En Lin; Rui Lyu
깊은 정렬 클러스터링을 이용한 새로운 의도 발견
초록

새로운 의도를 발견하는 것은 대화 시스템에서 중요한 작업입니다. 기존의 대부분 방법은 알려진 의도에서 새로운 의도로 사전 지식을 전달하는 데 제한이 있으며, 라벨링되지 않은 의도를 그룹화하기 위한 클러스터링 친화적 특성을 학습하는 데 필요한 고품질의 감독 신호를 제공하는 데 어려움을 겪습니다. 본 연구에서는 제한된 알려진 의도 데이터를 활용하여 새로운 의도를 발견할 수 있는 효과적인 방법인 딥 정렬 클러스터링(Deep Aligned Clustering)을 제안합니다. 첫째, 몇 개의 라벨링된 알려진 의도 샘플을 사전 지식으로 사용하여 모델을 사전 학습합니다. 둘째, k-means 알고리즘을 수행하여 클러스터 할당을 의사라벨(pseudo-labels)로 생성합니다. 또한, 클러스터링 할당 중에 발생하는 라벨 불일치 문제를 해결하기 위해 정렬 전략을 제안합니다. 마지막으로, 정렬된 의사라벨의 감독 아래에서 의도 표현을 학습합니다. 알려지지 않은 새로운 의도의 수가 있을 때, 우리는 낮은 신뢰도를 가진 의도별 클러스터를 제거하여 의도 범주의 수를 예측합니다. 두 개의 벤치마크 데이터셋에 대한 광범위한 실험 결과는 우리의 방법이 더 강건하며, 최신 방법들보다 실질적인 향상을 이루었다는 것을 보여줍니다. 코드는 https://github.com/thuiar/DeepAligned-Clustering 에서 공개되었습니다.

깊은 정렬 클러스터링을 이용한 새로운 의도 발견 | 최신 연구 논문 | HyperAI초신경