FaceForensics++ : Apprendre à détecter les images faciales manipulées

Les progrès rapides dans la génération et la manipulation d'images synthétiques ont atteint un stade où ils suscitent de graves préoccupations quant aux implications pour la société. Dans le meilleur des cas, cela entraîne une perte de confiance dans le contenu numérique, mais pourrait potentiellement causer davantage de dommages en propageant de fausses informations ou des fausses nouvelles. Cet article examine le réalisme des manipulations d'images les plus avancées et la difficulté à les détecter, que ce soit automatiquement ou par des humains. Pour standardiser l'évaluation des méthodes de détection, nous proposons un benchmark automatisé pour la détection de manipulations faciales. En particulier, ce benchmark est basé sur DeepFakes, Face2Face, FaceSwap et NeuralTextures (Neural Textures), qui sont des représentants éminents des manipulations faciales à différents niveaux de compression et tailles. Le benchmark est disponible au public et contient un ensemble de tests caché ainsi qu'une base de données comprenant plus de 1,8 million d'images manipulées. Cette base de données est plus d'un ordre de grandeur plus grande que les ensembles similaires disponibles publiquement. À partir de ces données, nous avons effectué une analyse approfondie des détecteurs de faux basés sur les données. Nous montrons que l'utilisation de connaissances spécifiques au domaine améliore considérablement la détection des faux, même en présence d'une forte compression, et dépasse nettement les observateurs humains.