Découvrir de nouvelles intentions avec le clustering profond aligné

Découvrir de nouvelles intentions est une tâche cruciale dans les systèmes de dialogue. La plupart des méthodes existantes sont limitées en ce qui concerne le transfert des connaissances antérieures des intentions connues vers les nouvelles intentions. Elles rencontrent également des difficultés pour fournir des signaux supervisés de haute qualité permettant d'apprendre des caractéristiques favorables à la classification pour regrouper les intentions non étiquetées. Dans cette étude, nous proposons une méthode efficace, le Clustering Profond Aligné (Deep Aligned Clustering), pour découvrir de nouvelles intentions avec l'aide de données d'intentions connues limitées. Tout d'abord, nous utilisons quelques échantillons d'intentions connues et étiquetés comme connaissances antérieures pour pré-entraîner le modèle. Ensuite, nous effectuons un k-means pour produire des affectations de clusters en tant que pseudo-étiquettes. De plus, nous proposons une stratégie d'alignement pour résoudre le problème d'incohérence des étiquettes lors des affectations de clusters. Enfin, nous apprenons les représentations d'intention sous la supervision des pseudo-étiquettes alignées. Avec un nombre inconnu de nouvelles intentions, nous prédisons le nombre de catégories d'intention en éliminant les clusters intentionnels à faible confiance. Des expériences approfondies sur deux jeux de données de référence montrent que notre méthode est plus robuste et réalise des améliorations substantielles par rapport aux méthodes les plus avancées actuellement disponibles. Le code source est disponible sur https://github.com/thuiar/DeepAligned-Clustering.