Command Palette
Search for a command to run...
물리 기반의 시공간 모델링을 통한 AI 생성 영상 탐지
물리 기반의 시공간 모델링을 통한 AI 생성 영상 탐지
Shuhai Zhang ZiHao Lian Jiahao Yang Daiyuan Li Guoxuan Pang Feng Liu Bo Han Shutao Li Mingkui Tan
초록
AI 기반 생성 영상은 Sora와 같은 사례에서 보듯 거의 완벽한 시각적 사실감을 달성하였으며, 이에 따라 신뢰할 수 있는 탐지 기법의 긴급한 필요성이 대두되고 있다. 그러나 이러한 영상의 탐지는 고차원의 시공간 동역학을 모델링하는 데 어려움을 겪고 있으며, 물리 법칙을 위반하는 미세한 이상 현상을 식별하는 데에도 큰 도전 과제가 있다. 본 논문에서는 확률 흐름 보존 원리를 기반으로 한 물리 기반의 AI 생성 영상 탐지 프레임워크를 제안한다. 구체적으로, 공간적 확률 기울기와 시간적 밀도 변화의 비율을 정량화하는 통계량인 정규화된 시공간 기울기(Normalized Spatiotemporal Gradient, NSG)를 제안하며, 이는 자연 영상의 동역학에서 벗어난 편차를 명시적으로 포착한다. 사전 학습된 확산 모델을 활용하여, 복잡한 운동 분해 없이 공간 기울기 근사 및 운동 인지형 시간 모델링을 통해 NSG 추정기를 개발함으로써 물리적 제약 조건을 유지한다. 이를 바탕으로, 테스트 영상과 실제 영상의 NSG 특징 간 최대 평균 차이(Mean Discrepancy, MMD)를 탐지 지표로 사용하는 NSG 기반 영상 탐지 방법(NSG-VD)을 제안한다. 마지막으로, 실제 영상과 생성 영상 간 NSG 특징 거리의 상한값을 도출하여, 생성 영상이 분포 이동(distributional shift)으로 인해 증폭된 편차를 보임을 수학적으로 증명한다. 광범위한 실험 결과는 NSG-VD가 최첨단 기준 대비 Recall에서 16.00%, F1-Score에서 10.75% 우수한 성능을 보였음을 확인하며, NSG-VD의 우수한 성능을 입증한다.