vor 8 Monaten

Zusammenfassung

Stimmenassistenten wie intelligente Lautsprecher haben an Popularität gewonnen. Es wird derzeit geschätzt, dass der Einführungsgrad von intelligenten Lautsprechern bei über 35 % der erwachsenen Bevölkerung in den USA liegt. Hersteller haben Sprechererkennungstechnologien integriert, die versuchen, die Identität des Sprechenden zu bestimmen, um personalisierte Dienstleistungen für verschiedene Familienmitglieder bereitzustellen. Die Sprechererkennung kann auch eine wichtige Rolle bei der Steuerung der Nutzung von intelligenten Lautsprechern spielen. Zum Beispiel ist es nicht kritisch, den Benutzer korrekt zu identifizieren, wenn Musik abgespielt wird. Bei der lautstarken Wiedergabe von E-Mails ist es jedoch entscheidend, die Identität des Anfragenden zu verifizieren und sicherzustellen, dass er ein autorisierter Benutzer ist. Daher sind Sprecherverifikationssysteme erforderlich, die als Schutzschirm dienen, um vor verschiedenen Spoofing-Angriffen zu schützen, die darauf abzielen, den registrierten Benutzer zu imitieren. In dieser Arbeit werden gängige lernfähige Front-Ends verglichen, die durch gemeinsames Training mit nachgelagerten Aufgaben (End-to-End) Audiodarstellungen erlernen. Wir klassifizieren die Front-Ends durch die Definition zweier generischer Architekturen und analysieren dann die Filterstufen beider Arten hinsichtlich ihrer Lernbeschränkungen. Wir schlagen vor, feste Filterbänke durch eine lernfähige Schicht zu ersetzen, die sich besser an Anti-Spoofing-Aufgaben anpassen kann. Das vorgeschlagene FastAudio-Front-End wird dann mit zwei gängigen Back-Ends getestet, um dessen Leistung auf dem LA-Pfad des ASVspoof 2019-Datensatzes zu messen. Das FastAudio-Front-End erreicht eine relative Verbesserung von 27 % im Vergleich zu festgelegten Front-Ends und übertrifft alle anderen lernfähigen Front-Ends in dieser Aufgabe.请注意，这里将 "intelligente Lautsprecher" 翻译为 "智能扬声器" 的对应德语，以保持科技领域的专业性和准确性。同时，对一些特定术语如 "Front-End", "Back-End", "ASVspoof 2019-Datensatz" 等保留了其在德语中的通用形式。

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Audio- Und Sprachverarbeitung

Hassan Saeed

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 8 Monaten

Audio- Und Sprachverarbeitung

Hassan Saeed

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

FastAudio: Ein lernfähiges Audio-Front-End für die Erkennung von Spoof-Sprechsignalen | Paper | HyperAI

Command Palette

FastAudio: Ein lernfähiges Audio-Front-End für die Erkennung von Spoof-Sprechsignalen

Hassan Saeed

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

FastAudio: Ein lernfähiges Audio-Front-End für die Erkennung von Spoof-Sprechsignalen

Hassan Saeed

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

FastAudio: Ein lernfähiges Audio-Front-End für die Erkennung von Spoof-Sprechsignalen

Hassan Saeed

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters