
摘要
为应对现实生活中常见的、涉及多种类型且常以复合方式出现的图像伪造问题,本文提出了一种统一的深度神经网络架构——ManTra-Net。与现有大多数方法不同,ManTra-Net是一种端到端网络,无需额外的预处理或后处理即可同时实现伪造检测与定位。该网络基于全卷积结构,能够处理任意尺寸的图像,并有效识别多种已知伪造类型,包括图像拼接(splicing)、复制-粘贴(copy-move)、内容删除(removal)、图像增强(enhancement)等,甚至可应对未知类型的伪造。本文的主要贡献有三点:首先,我们设计了一种简单而高效的自监督学习任务,通过分类385种不同的图像操作类型,学习鲁棒的图像篡改痕迹特征;其次,我们将伪造定位问题建模为局部异常检测任务,提出一种Z-score特征以捕捉局部异常,并设计了一种新型的长短期记忆(LSTM)机制来评估局部异常程度;最后,我们通过精心设计的消融实验,系统性地优化了所提出的网络结构。大量实验结果表明,ManTra-Net在单一伪造类型以及复杂组合伪造场景下均展现出优异的泛化能力、鲁棒性与性能优势,显著优于现有方法。