Auto-ajustement du clustering spectral pour la diarisation vocale par écart eigengap maximal normalisé

Dans cette étude, nous proposons un nouveau cadre de clustering spectral capable d’ajuster automatiquement les paramètres de l’algorithme de clustering dans le contexte de la diarisation vocale. Le cadre proposé utilise les valeurs d’écart propre maximal normalisé (NME, normalized maximum eigengap) pour estimer le nombre de clusters ainsi que les paramètres du seuil des éléments de chaque ligne d’une matrice d’affinité durant le processus de clustering spectral, sans nécessiter d’ajustement de paramètres sur un ensemble de développement. Malgré cette approche sans intervention manuelle, nous obtenons des performances comparables ou supérieures à celles des méthodes traditionnelles de clustering, qui reposent sur un ajustement soigneux des paramètres et l’utilisation d’un ensemble de développement. Une amélioration relative de 17 % du taux d’erreur vocale sur l’ensemble d’évaluation bien connu CALLHOME démontre l’efficacité de notre méthode de clustering spectral avec ajustement automatique.