HyperAIHyperAI
vor 2 Monaten

FastAudio: Ein lernfähiges Audio-Front-End für die Erkennung von Spoof-Sprechsignalen

Fu, Quchen ; Teng, Zhongwei ; White, Jules ; Powell, Maria ; Schmidt, Douglas C.
FastAudio: Ein lernfähiges Audio-Front-End für die Erkennung von Spoof-Sprechsignalen
Abstract

Stimmenassistenten wie intelligente Lautsprecher haben an Popularität gewonnen. Es wird derzeit geschätzt, dass der Einführungsgrad von intelligenten Lautsprechern bei über 35 % der erwachsenen Bevölkerung in den USA liegt. Hersteller haben Sprechererkennungstechnologien integriert, die versuchen, die Identität des Sprechenden zu bestimmen, um personalisierte Dienstleistungen für verschiedene Familienmitglieder bereitzustellen. Die Sprechererkennung kann auch eine wichtige Rolle bei der Steuerung der Nutzung von intelligenten Lautsprechern spielen. Zum Beispiel ist es nicht kritisch, den Benutzer korrekt zu identifizieren, wenn Musik abgespielt wird. Bei der lautstarken Wiedergabe von E-Mails ist es jedoch entscheidend, die Identität des Anfragenden zu verifizieren und sicherzustellen, dass er ein autorisierter Benutzer ist. Daher sind Sprecherverifikationssysteme erforderlich, die als Schutzschirm dienen, um vor verschiedenen Spoofing-Angriffen zu schützen, die darauf abzielen, den registrierten Benutzer zu imitieren. In dieser Arbeit werden gängige lernfähige Front-Ends verglichen, die durch gemeinsames Training mit nachgelagerten Aufgaben (End-to-End) Audiodarstellungen erlernen. Wir klassifizieren die Front-Ends durch die Definition zweier generischer Architekturen und analysieren dann die Filterstufen beider Arten hinsichtlich ihrer Lernbeschränkungen. Wir schlagen vor, feste Filterbänke durch eine lernfähige Schicht zu ersetzen, die sich besser an Anti-Spoofing-Aufgaben anpassen kann. Das vorgeschlagene FastAudio-Front-End wird dann mit zwei gängigen Back-Ends getestet, um dessen Leistung auf dem LA-Pfad des ASVspoof 2019-Datensatzes zu messen. Das FastAudio-Front-End erreicht eine relative Verbesserung von 27 % im Vergleich zu festgelegten Front-Ends und übertrifft alle anderen lernfähigen Front-Ends in dieser Aufgabe.请注意,这里将 "intelligente Lautsprecher" 翻译为 "智能扬声器" 的对应德语,以保持科技领域的专业性和准确性。同时,对一些特定术语如 "Front-End", "Back-End", "ASVspoof 2019-Datensatz" 等保留了其在德语中的通用形式。

FastAudio: Ein lernfähiges Audio-Front-End für die Erkennung von Spoof-Sprechsignalen | Neueste Forschungsarbeiten | HyperAI