HyperAIHyperAI
il y a 2 mois

Détection en temps réel de la parole générée par IA pour la conversion de voix DeepFake

Bird, Jordan J. ; Lotfi, Ahmad
Détection en temps réel de la parole générée par IA pour la conversion de voix DeepFake
Résumé

Les implications croissantes de l'IA générative dans le domaine de la parole, qui permettent le clonage vocal et la conversion en temps réel de la voix d'un individu à un autre, posent une menace éthique significative et pourraient entraîner des violations de la vie privée et des représentations erronées. Il existe donc un besoin urgent de détecter en temps réel les discours générés par IA pour contrer la conversion de voix profonde (DeepFake Voice Conversion). Pour répondre aux problèmes émergents susmentionnés, cette étude a généré le jeu de données DEEP-VOICE, composé de discours humains réels provenant de huit personnalités célèbres et de leurs discours convertis les uns en les autres à l'aide d'une méthode de conversion vocale basée sur la recherche (Retrieval-based Voice Conversion). Présenté sous forme d'un problème de classification binaire visant à déterminer si le discours est réel ou généré par IA, l'analyse statistique des caractéristiques audio temporelles par test t révèle des distributions significativement différentes. Une optimisation des hyperparamètres est mise en œuvre pour les modèles d'apprentissage automatique afin d'identifier l'origine du discours. Après avoir formé 208 modèles d'apprentissage automatique individuels sur une validation croisée à 10 plis, il a été constaté que le modèle d'Extreme Gradient Boosting peut atteindre une précision moyenne de classification de 99,3 % et classer le discours en temps réel, environ 0,004 millisecondes étant nécessaires pour une seconde de discours. Toutes les données générées dans le cadre de cette étude sont rendues publiques pour des recherches futures sur la détection du discours généré par IA.

Détection en temps réel de la parole générée par IA pour la conversion de voix DeepFake | Articles de recherche récents | HyperAI