Command Palette
Search for a command to run...
Audio-Spoofing-Verifizierung mittels Deep Convolutional Neural Networks durch Transfer Learning
Audio-Spoofing-Verifizierung mittels Deep Convolutional Neural Networks durch Transfer Learning
Rahul T P P R Aravind Ranjith C Usamath Nechiyil Nandakumar Paramparambath
Zusammenfassung
Automatische Sprecherverifizierungssysteme gewinnen derzeit zunehmend an Beliebtheit; Spoofing-Angriffe stellen dabei eine zentrale Bedrohung dar, da sie diese Systeme anfällig machen. Einige Spoofing-Angriffe wie Replay-Angriffe sind relativ einfach durchzuführen, jedoch äußerst schwer zu erkennen, was die Notwendigkeit geeigneter Gegenmaßnahmen erhöht. In diesem Artikel stellen wir einen Sprachklassifikator vor, der auf einem tiefen konvolutionellen neuronalen Netzwerk basiert, um Spoofing-Angriffe zu detektieren. Unsere vorgeschlagene Methode nutzt die akustische Zeit-Frequenz-Darstellung der Leistungsspektraldichten auf der Mel-Frequenzskala (Mel-Spektrogramm) mittels tiefer Residual-Lernverfahren (Anpassung der ResNet-34-Architektur). Mit einem einzigen Modellsystem erreichen wir eine Equal-Error-Rate (EER) von 0,9056 % auf dem Entwicklungsdataset und 5,32 % auf dem Evaluationsdataset des logischen Zugriffszenarios sowie eine EER von 5,87 % auf dem Entwicklungsdataset und 5,74 % auf dem Evaluationsdataset des physischen Zugriffszenarios des ASVspoof 2019.