CIFAKE : Classification d'images et identification explicite d'images synthétiques générées par IA

Les avancées technologiques récentes dans le domaine des données synthétiques ont permis de générer des images d'une qualité telle que les êtres humains ne parviennent plus à distinguer les photographies réelles des images générées par l'intelligence artificielle (IA). Étant donné la nécessité cruciale de fiabilité et d'authentification des données, cet article propose d'améliorer notre capacité à reconnaître les images générées par IA à l'aide de la vision par ordinateur. Initialement, un jeu de données synthétique est généré afin de refléter les dix catégories du jeu de données CIFAR-10 existant, en utilisant une diffusion latente, fournissant ainsi un ensemble contrasté d'images pour comparaison avec des photographies réelles. Le modèle est capable de produire des attributs visuels complexes, tels que des reflets photoréalistes sur l'eau. Les deux ensembles de données constituent un problème de classification binaire, visant à déterminer si une image est réelle ou générée par IA. Cette étude propose ensuite l'utilisation d'un réseau de neurones convolutif (CNN) pour classifier les images en deux catégories : « Réelle » ou « Fausse ». Après une optimisation des hyperparamètres et l'entraînement de 36 topologies de réseaux distinctes, l'approche optimale a permis de classifier correctement les images avec une précision de 92,98 %. Enfin, cette étude met en œuvre une IA explicable via la carte d'activation de gradient (Gradient Class Activation Mapping) afin d'analyser les caractéristiques internes des images jugées pertinentes pour la classification. L'interprétation révèle des concepts intéressants : en particulier, il apparaît que l'entité principale de l'image ne contient pas d'informations utiles pour la classification ; au contraire, le modèle se concentre sur de petites imperfections visuelles présentes dans le fond des images. L'ensemble de données entièrement conçu dans le cadre de cette étude, désigné sous le nom de CIFAKE, est mis à disposition publiquement à la communauté scientifique afin de faciliter les travaux futurs.