HyperAIHyperAI
il y a 18 jours

La recherche sur la détection des voix synthétiques est-elle en train de suivre la bonne direction ?

{Dario Allegra, Filippo Stanco, Oliver Giudice, Stefano Borzì}
La recherche sur la détection des voix synthétiques est-elle en train de suivre la bonne direction ?
Résumé

L'apprentissage automatique, et plus généralement les approches de l'intelligence artificielle, ont permis des progrès considérables dans tous les domaines de l'informatique, en augmentant significativement le niveau de précision des modèles prédictifs sur tout type de problème connu. En effet, cette évolution a permis la conception de cadres et de solutions efficaces pouvant être appliqués dans des contextes d'enquête et de forensic afin de détecter les contenus manipulés, notamment les faux médias. Toutefois, pouvons-nous vraiment faire confiance à ces systèmes ? La recherche progresse-t-elle dans la bonne direction ? Ne nous contentons-nous pas de cibler des problèmes faciles, en ignorant de nombreuses situations réelles rencontrées dans des environnements complexes ? Le but de cet article est d'alerter la communauté scientifique sur un contexte particulier : la détection des voix synthétiques, où les jeux de données disponibles pour l'entraînement sont insuffisants pour garantir une confiance adéquate dans les techniques décrites dans la littérature. À cet effet, une étude exploratoire a été menée sur le jeu de données le plus couramment utilisé pour la détection de spoofing vocal. Il s'est avéré surprenant qu'il soit possible de concevoir des classificateurs simples, sans recourir à des techniques d'apprentissage profond, capables d'obtenir une performance de détection efficace. Des considérations élémentaires sur le taux de bits (bitrate) s'avèrent suffisantes pour atteindre de bons résultats.