HyperAIHyperAI
vor 11 Tagen

Spoofing-robuste Sprachverifizierung basierend auf Zeitbereichs-Embedding

{Itshak Lapidot, Yehuda Ben-Shimol, Avishai Weizman}
Abstract

Die spoofing-robuste Sprachverifizierungstechnologie dient dazu, sprachbasierte Authentifizierungssysteme vor betrügerischen Angriffen zu schützen. Ein solches System muss in der Lage sein, gefälschte Sprachsegmente zu erkennen und echte, als authentisch identifizierte Sprachsegmente daraufhin zu überprüfen, ob sie tatsächlich vom echten Sprecher stammen. In dieser Forschung wird ein verständliches und erklärbares Embedding verwendet, das auf der Wahrscheinlichkeitsmassefunktion der Amplituden des Signalverlaufs im Zeitbereich basiert. Die Ergebnisse zeigen, dass die Leistung des Gegenmaßnahmesystems (Countermeasure, CM) verbessert wird, wenn es geschlechtsabhängig gestaltet ist. Zur Evaluierung wurde die ASVspoof2019-Challenge, Datenbank für logischen Zugriff (LA), herangezogen. Das geschlechtsabhängige CM-System erreichte auf der Evaluierungsgruppe eine Equal Error Rate (EER) von 9,2 % bei Männern und 10,1 % bei Frauen. Im Gegensatz dazu wies ein geschlechtsunabhängiges CM-System eine EER von 10,2 % auf. Die Systemleistung, gemessen an der Detektionskostfunktion für die Tandem-Auswertung (t-DCF), beträgt 0,262 für das geschlechtsabhängige System und 0,328 für das geschlechtsunabhängige System.

Spoofing-robuste Sprachverifizierung basierend auf Zeitbereichs-Embedding | Neueste Forschungsarbeiten | HyperAI