Evaluierung von Identitätslecks in Sprecher-De-Identifizierungssystemen

Die Sprecher-De-Identifikation zielt darauf ab, die Identität eines Sprechers zu verbergen, während die Verständlichkeit des zugrundeliegenden Sprachsignals erhalten bleibt. Wir stellen eine Benchmark vor, die die verbleibende Identitätsleakage mittels drei ergänzender Fehlerraten quantifiziert: Equal Error Rate (EER), Cumulative Match Characteristic (CMC)-Hitrate und Ähnlichkeit im Embedding-Raum, gemessen mittels kanonischer Korrelationsanalyse und Prokrustes-Analyse. Die Evaluierungsergebnisse zeigen, dass alle aktuell besten Sprecher-De-Identifikationssysteme Identitätsinformation preisgeben. Das leistungsstärkste System in unserer Bewertung erzielt nur geringfügig bessere Ergebnisse als reiner Zufall, während das schlechteste System eine Trefferquote von 45 % innerhalb der Top-50-Kandidaten basierend auf der CMC erreicht. Diese Ergebnisse unterstreichen die anhaltenden Datenschutzrisiken bestehender Sprecher-De-Identifikationstechnologien.