vor 10 Monaten

Tao Hu Shuangbing Wen Qishan Zhang

Zusammenfassung

Generative KI-Technologien, darunter Text-zu-Sprache (TTS) und Sprachkonvertierung (VC), werden zunehmend von echten Aufnahmen nicht mehr unterscheidbar, was für Individuen erhebliche Schwierigkeiten bei der Unterscheidung zwischen echtem und synthetischem Inhalt darstellt. Diese Ununterscheidbarkeit untergräbt das Vertrauen in Medien, und die willkürliche Nachbildung persönlicher Sprachsignale stellt erhebliche Herausforderungen für Datenschutz und Sicherheit dar. In der Forschung zu Deepfake-Audio-Detektion setzen die meisten Modelle, die derzeit eine hohe Detektionsgenauigkeit erzielen, auf selbstüberwachte vortrainierte Modelle. Doch mit der kontinuierlichen Weiterentwicklung von Deepfake-Audio-Generierungsalgorithmen wird die Aufrechterhaltung einer hohen Unterscheidungsgenauigkeit gegenüber neuen Algorithmen zunehmend herausfordernder. Um die Empfindlichkeit der Deepfake-Audio-merkmale zu erhöhen, schlagen wir ein Deepfake-Audio-Detektionsmodell vor, das einen SLS-Modul (Sensitive Layer Selection) integriert. Konkret ermöglicht die Nutzung des vortrainierten XLS-R-Modells, dass unser Modell diverse Audio-merkmale aus verschiedenen Schichten extrahiert, wobei jede Schicht unterschiedliche diskriminative Informationen liefert. Mit dem SLS-Klassifikator erfasst unser Modell sensible kontextuelle Informationen über verschiedene Schichtebenen der Audio-merkmale und nutzt diese effektiv für die Erkennung von gefälschten Audiodaten. Experimentelle Ergebnisse zeigen, dass unsere Methode sowohl auf dem ASVspoof 2021 DF- als auch auf dem In-the-Wild-Datensatz state-of-the-art (SOTA)-Leistung erzielt, mit einer spezifischen Equal Error Rate (EER) von 1,92 % auf dem ASVspoof 2021 DF-Datensatz und 7,46 % auf dem In-the-Wild-Datensatz. Der Quellcode und die Daten sind unter https://github.com/QiShanZhang/SLSforADD verfügbar.

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

vor 10 Monaten

Audio- Und Sprachverarbeitung

Text-to-Speech

Tiefes Lernen

Tao Hu Shuangbing Wen Qishan Zhang

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

vor 10 Monaten

Audio- Und Sprachverarbeitung

Text-to-Speech

Tiefes Lernen

Tao Hu Shuangbing Wen Qishan Zhang

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Audio-Deepfake-Erkennung mit selbstüberwachtem XLS-R und SLS-Klassifizierer | Paper | HyperAI

Command Palette

Audio-Deepfake-Erkennung mit selbstüberwachtem XLS-R und SLS-Klassifizierer

Tao Hu Shuangbing Wen Qishan Zhang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Audio-Deepfake-Erkennung mit selbstüberwachtem XLS-R und SLS-Klassifizierer

Tao Hu Shuangbing Wen Qishan Zhang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Audio-Deepfake-Erkennung mit selbstüberwachtem XLS-R und SLS-Klassifizierer

Tao Hu Shuangbing Wen Qishan Zhang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters