HyperAIHyperAI

Command Palette

Search for a command to run...

Détection des deepfakes audio-visuels par apprentissage profond

Ser-Nam Lim Yipin Zhou

Résumé

Les deepfakes (« deep learning » + « fake ») sont des vidéos générées de manière synthétique par des algorithmes d’intelligence artificielle. Bien qu’ils puissent être amusants, ils peuvent également être utilisés de manière malveillante pour falsifier des discours ou propager de la désinformation. La création de deepfakes repose sur des manipulations à la fois visuelles et auditives. Si des recherches ont déjà abouti à plusieurs méthodes de détection des deepfakes visuels ainsi qu’à la mise en place de jeux de données dédiés, les deepfakes audio (par exemple, des paroles synthétiques produites par des systèmes de synthèse vocale ou de conversion de voix) ainsi que les interactions entre les modalités visuelle et auditive ont été relativement négligées. Dans ce travail, nous proposons une nouvelle tâche de détection conjointe des deepfakes visuels et auditifs, et montrons que l’exploitation de la synchronisation intrinsèque entre ces deux modalités peut améliorer significativement la détection des deepfakes. Les expérimentations démontrent que le cadre de détection conjointe proposé surpasse les modèles entraînés indépendamment, tout en offrant une meilleure capacité de généralisation face à des types de deepfakes inédits.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp