
최근 합성 데이터 기술의 발전으로 인해 인공지능(AI)이 생성한 이미지의 품질이 매우 높아져 인간이 실제 사진과 AI 생성 이미지 사이의 차이를 구분하기 어려운 수준에 이르렀다. 데이터 신뢰성과 인증의 절대적인 필요성에 비추어, 본 논문은 컴퓨터 비전 기술을 활용하여 AI 생성 이미지를 인식하는 능력을 향상시키는 방안을 제안한다. 먼저, 기존에 존재하는 CIFAR-10 데이터셋의 10개 클래스를 모방하는 합성 데이터셋을 생성하였으며, 이는 잠재적 확산(latent diffusion) 기법을 활용하여 실제 사진과 대비되는 이미지 세트를 제공한다. 해당 모델은 물면에 존재하는 사실적인 반사와 같은 복잡한 시각적 특징을 생성할 수 있다. 두 데이터 세트는 사진이 실제인지 AI에 의해 생성되었는지 여부를 구분하는 이진 분류 문제로 설정된다. 본 연구는 이를 해결하기 위해 합성곱 신경망(Convolutional Neural Network, CNN)을 활용하여 이미지를 '실제(True)' 또는 '가짜(Fake)'로 분류하는 방안을 제시한다. 하이퍼파라미터 튜닝 및 36개의 개별 네트워크 아키텍처에 대한 학습을 거친 결과, 최적의 접근 방식은 이미지 분류 정확도 92.98%를 달성하였다. 마지막으로, 분류에 기여하는 이미지 내 특징을 탐색하기 위해 경사 클래스 활성화 맵(Gradient Class Activation Mapping, Grad-CAM)을 활용한 설명 가능한 인공지능(Explainable AI) 기법을 도입하였다. 해석 결과, 이미지의 실제 주체 자체는 분류에 유용한 정보를 제공하지 않으며, 오히려 이미지의 배경에 존재하는 미세한 시각적 결함이 모델의 주요 분류 기준임을 확인할 수 있었다. 본 연구에서 설계한 완전한 데이터셋은 CIFAKE 데이터셋이라고 명명되었으며, 향후 연구를 위한 공개를 목적으로 연구 공동체에 공개된다.