HyperAIHyperAI

Command Palette

Search for a command to run...

Auto-Tuning des Spektral-Clustering für die Sprecher-Diarisierung unter Verwendung des normalisierten maximalen Eigenwertabstands

Tae Jin Park Kyu J. Han Manoj Kumar Shrikanth Narayanan

Zusammenfassung

In dieser Studie stellen wir einen neuen Spektralclustering-Framework vor, der die Parameter des Clustering-Algorithmus im Kontext der Sprecherdiarisation automatisch anpassen kann. Der vorgeschlagene Ansatz nutzt die normalisierten maximalen Eigenwertlücken (NME, normalized maximum eigengap) zur Schätzung der Anzahl von Clustern sowie der Parameter für den Schwellwert der Elemente jeder Zeile einer Affinitätsmatrix während des Spektralclustering, ohne dass eine Parameteranpassung an einem Entwicklungsdatensatz erforderlich ist. Trotz dieses „hands-off“-Ansatzes erreichen wir eine vergleichbare oder sogar bessere Leistung auf verschiedenen Evaluationsdatensätzen im Vergleich zu traditionellen Clustering-Methoden, die sorgfältige Parameteranpassung und Nutzung von Entwicklungsdaten erfordern. Eine relative Verbesserung von 17 % beim Sprecherfehlerrate auf dem bekannten CALLHOME-Evaluationsdatensatz belegt die Wirksamkeit unseres vorgeschlagenen spektralen Clustering-Ansatzes mit automatischer Parameteranpassung.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp