CIFAKE: Bildklassifizierung und erklärbare Erkennung künstlich generierter synthetischer Bilder

Durch jüngste technologische Fortschritte bei synthetischen Daten ist die Erzeugung von Bildern mit einer Qualität gelungen, die es Menschen unmöglich macht, den Unterschied zwischen realen Fotografien und künstlich durch Künstliche Intelligenz (KI) generierten Bildern zu erkennen. Angesichts der entscheidenden Bedeutung von Datenzuverlässigkeit und Authentifizierung schlägt dieser Artikel vor, unsere Fähigkeit zur Erkennung von KI-generierten Bildern durch Computer Vision zu verbessern. Zunächst wird ein synthetischer Datensatz erstellt, der die zehn Klassen des bereits verfügbaren CIFAR-10-Datensatzes nachbildet, wobei latente Diffusionsmodelle eingesetzt werden, um einen kontrastierenden Satz von Bildern bereitzustellen, die mit realen Fotografien verglichen werden können. Das Modell ist in der Lage, komplexe visuelle Merkmale wie fotorealistische Reflexionen im Wasser zu generieren. Die beiden Datensätze bilden ein binäres Klassifikationsproblem, das entscheidet, ob ein Bild echt oder von einer KI generiert ist. In dieser Studie wird ein Faltungsneuronales Netzwerk (Convolutional Neural Network, CNN) vorgeschlagen, um die Bilder in die Kategorien „Real“ oder „Fake“ zu klassifizieren. Nach der Hyperparameter-Optimierung und dem Training von 36 individuellen Netzwerkarchitekturen erreicht der optimale Ansatz eine Klassifizierungsgenauigkeit von 92,98 %. Schließlich wird erklärbare KI mittels Gradient Class Activation Mapping (Grad-CAM) eingesetzt, um zu untersuchen, welche Merkmale innerhalb der Bilder für die Klassifikation relevant sind. Die Interpretation offenbart interessante Erkenntnisse: Insbesondere zeigt sich, dass das eigentliche Objekt im Bild für die Klassifikation wenig aussagekräftig ist; vielmehr konzentriert sich das Modell auf kleine visuelle Unvollkommenheiten im Hintergrund der Bilder. Der vollständige für diese Studie entwickelte Datensatz, der als CIFAKE-Datensatz bezeichnet wird, wird der Forschungsgemeinschaft öffentlich zur Verfügung gestellt, um zukünftige Arbeiten zu ermöglichen.