
摘要
近年来,合成数据技术的快速发展使得人工智能(AI)生成图像的质量不断提升,其逼真程度已达到人类难以区分真实照片与AI生成图像的程度。鉴于数据可靠性与真实性验证的迫切需求,本文提出通过计算机视觉手段增强对AI生成图像的识别能力。首先,利用潜在扩散模型(latent diffusion)构建了一个合成数据集,该数据集在类别上与现有的CIFAR-10数据集保持一致,包含十个类别,从而为真实照片提供对比样本。该模型能够生成复杂的视觉特征,例如水面中的逼真倒影。由此形成的两组数据构成一个二分类问题:判断图像是否为真实拍摄或由AI生成。本研究进一步提出采用卷积神经网络(Convolutional Neural Network, CNN)对图像进行分类,判别其为“真实”或“伪造”两类。在对36种不同的网络架构进行超参数调优与训练后,最优模型在测试集上实现了92.98%的分类准确率。最后,本文通过可解释人工智能技术中的梯度类激活映射(Gradient Class Activation Mapping, Grad-CAM)方法,分析图像中对分类决策具有贡献的关键视觉特征。分析结果揭示出一些有趣的发现:图像中的主体实体本身对分类并无显著帮助,相反,模型主要关注图像背景中存在的细微视觉瑕疵。这些微小的不一致性,如纹理不连续、光照异常或边缘模糊等,成为区分真实与生成图像的关键线索。本研究所构建的完整数据集,命名为CIFAKE数据集,已向科研界公开共享,旨在为后续相关研究提供高质量的基准数据支持。