摘要

为应对现实生活中常见的、涉及多种类型且常以复合方式出现的图像伪造问题，本文提出了一种统一的深度神经网络架构——ManTra-Net。与现有大多数方法不同，ManTra-Net是一种端到端网络，无需额外的预处理或后处理即可同时实现伪造检测与定位。该网络基于全卷积结构，能够处理任意尺寸的图像，并有效识别多种已知伪造类型，包括图像拼接（splicing）、复制-粘贴（copy-move）、内容删除（removal）、图像增强（enhancement）等，甚至可应对未知类型的伪造。本文的主要贡献有三点：首先，我们设计了一种简单而高效的自监督学习任务，通过分类385种不同的图像操作类型，学习鲁棒的图像篡改痕迹特征；其次，我们将伪造定位问题建模为局部异常检测任务，提出一种Z-score特征以捕捉局部异常，并设计了一种新型的长短期记忆（LSTM）机制来评估局部异常程度；最后，我们通过精心设计的消融实验，系统性地优化了所提出的网络结构。大量实验结果表明，ManTra-Net在单一伪造类型以及复杂组合伪造场景下均展现出优异的泛化能力、鲁棒性与性能优势，显著优于现有方法。

源 PDF 查看代码