11일 전

SPAN: 이미지 조작 탐지를 위한 공간계층 주의망

{Zhenheng Yang, Zhihan Zhang, Zhenye Jiang, Xuefeng Hu, Ram Nevatia, Syomantak Chaudhuri}
SPAN: 이미지 조작 탐지를 위한 공간계층 주의망
초록

이미지 조작 기술은 급속도로 발전하고 있으며, 이러한 기술은 다양한 유용한 작업에 도움을 주지만, 현실감 있는 오보를 생성할 수 있다는 점에서 사회에 위협을 가하고 있다. 본 연구에서는 다양한 유형의 이미지 조작을 탐지하고 정확히 위치를 식별하기 위한 새로운 공간 계층 주의 네트워크(Spatial Pyramid Attention Network, SPAN)를 제안한다. 제안된 아키텍처는 다중 스케일의 이미지 패치 간의 관계를 효과적으로 모델링하기 위해 로컬 자기 주의(self-attention) 블록을 계층 구조로 구성한다. 또한, 패치의 공간적 위치를 정확히 인코딩하기 위한 새로운 위치 투영(position projection) 기법을 도입하였다. SPAN은 합성 데이터셋으로 학습되며, 특정 데이터셋에 대해 미세 조정(fine-tuning)이 가능하다. 제안된 방법은 기존 최고 수준의 기법들에 비해 표준 데이터셋에서 뚜렷한 성능 향상을 보였다.

SPAN: 이미지 조작 탐지를 위한 공간계층 주의망 | 최신 연구 논문 | HyperAI초신경