HyperAIHyperAI
vor 2 Monaten

Entdeckung neuer Absichten durch tiefes aligniertes Clustering

Hanlei Zhang; Hua Xu; Ting-En Lin; Rui Lyu
Entdeckung neuer Absichten durch tiefes aligniertes Clustering
Abstract

Die Entdeckung neuer Intentionen ist eine entscheidende Aufgabe in Dialogsystemen. Die meisten existierenden Methoden sind jedoch begrenzt in der Übertragung von Vorwissen von bekannten Intentionen auf neue Intentionen. Sie haben auch Schwierigkeiten, hochwertige überwachte Signale bereitzustellen, um für die Gruppierung unbeschrifteter Intentionen clustering-freundliche Merkmale zu lernen. In dieser Arbeit schlagen wir eine effektive Methode vor, das tiefe ausgerichtete Clustering (Deep Aligned Clustering), um mit Hilfe der begrenzten Daten bekannter Intentionen neue Intentionen zu entdecken. Zunächst nutzen wir einige beschriftete Stichproben bekannter Intentionen als Vorwissen, um das Modell vorzutrainieren. Anschließend führen wir k-Means durch, um Clusterzuordnungen als Pseudo-Labels zu erzeugen. Darüber hinaus schlagen wir eine Ausrichtungsstrategie vor, um das Problem der Label-Inkonsistenzen während der Clusterzuordnungen anzugehen. Schließlich lernen wir die Intent-Darstellungen unter der Aufsicht der ausgerichteten Pseudo-Labels. Bei einer unbekannten Anzahl neuer Intentionen bestimmen wir die Anzahl der Intent-Kategorien, indem wir Intent-Cluster mit geringem Vertrauensgrad eliminieren. Umfangreiche Experimente auf zwei Benchmark-Datensätzen zeigen, dass unsere Methode robuster ist und erhebliche Verbesserungen gegenüber den Stand-of-the-Art-Methoden erreicht. Der Quellcode wird unter https://github.com/thuiar/DeepAligned-Clustering veröffentlicht.