HyperAIHyperAI
vor 9 Tagen

Auto-Tuning des Spektral-Clustering für die Sprecher-Diarisierung unter Verwendung des normalisierten maximalen Eigenwertabstands

Tae Jin Park, Kyu J. Han, Manoj Kumar, Shrikanth Narayanan
Auto-Tuning des Spektral-Clustering für die Sprecher-Diarisierung unter Verwendung des normalisierten maximalen Eigenwertabstands
Abstract

In dieser Studie stellen wir einen neuen Spektralclustering-Framework vor, der die Parameter des Clustering-Algorithmus im Kontext der Sprecherdiarisation automatisch anpassen kann. Der vorgeschlagene Ansatz nutzt die normalisierten maximalen Eigenwertlücken (NME, normalized maximum eigengap) zur Schätzung der Anzahl von Clustern sowie der Parameter für den Schwellwert der Elemente jeder Zeile einer Affinitätsmatrix während des Spektralclustering, ohne dass eine Parameteranpassung an einem Entwicklungsdatensatz erforderlich ist. Trotz dieses „hands-off“-Ansatzes erreichen wir eine vergleichbare oder sogar bessere Leistung auf verschiedenen Evaluationsdatensätzen im Vergleich zu traditionellen Clustering-Methoden, die sorgfältige Parameteranpassung und Nutzung von Entwicklungsdaten erfordern. Eine relative Verbesserung von 17 % beim Sprecherfehlerrate auf dem bekannten CALLHOME-Evaluationsdatensatz belegt die Wirksamkeit unseres vorgeschlagenen spektralen Clustering-Ansatzes mit automatischer Parameteranpassung.

Auto-Tuning des Spektral-Clustering für die Sprecher-Diarisierung unter Verwendung des normalisierten maximalen Eigenwertabstands | Neueste Forschungsarbeiten | HyperAI