Découverte de Nouvelles Intentions par le Clustering Adaptatif Profond Contraint avec Affinement des Clusters

L'identification de nouvelles intentions d'utilisateurs est une tâche essentielle dans les systèmes de dialogue. Cependant, il est difficile d'obtenir des résultats de clustering satisfaisants car la définition des intentions est fortement guidée par des connaissances a priori. Les méthodes existantes intègrent ces connaissances a priori par un ingénierie intensive des caractéristiques, ce qui non seulement conduit au surapprentissage mais rend également le clustering sensible au nombre de clusters. Dans cet article, nous proposons le clustering profond adaptatif contraint avec raffinement de clusters (CDAC+), une méthode de clustering bout-à-bout capable d'intégrer naturellement des contraintes paires comme connaissances a priori pour guider le processus de clustering. De plus, nous affinons les clusters en forçant le modèle à apprendre à partir des affectations à forte confiance. Après l'élimination des affectations à faible confiance, notre approche s'avère étonnamment insensible au nombre de clusters. Les résultats expérimentaux sur trois jeux de données de référence montrent que notre méthode peut apporter des améliorations significatives par rapport aux baselines solides.