ForgeryNet 数据集是一个庞大且全面的基准测试,专为深度伪造分析而构建。它包含了 290 万张图像和 221,247 个视频,涵盖了来自全球的 7 种图像层面和 8 种视频层面的伪造操作方法。这个数据集为研究者提供了丰富的资源,以支持图像和视频层面的四种任务:图像伪造分类、空间伪造定位、视频伪造分类和时间伪造定位。这些任务包括了从二分类到多分类的图像伪造识别,以及对伪造区域的空间和时间定位。
ForgeryNet 数据集的规模和多样性使其成为目前公开的最大的深度人脸伪造数据集。特点如下:
- data-scale:290 万张图像、 221 247 个视频
- manipulations:7 种图像级方法,8 种视频级方法
- perturbations:36 种独立扰动和更多混合扰动
- annotations:630 万个分类标签、 290 万个操作区域标注和 221,247 个时间伪造段标签
可用于以下四项任务:
- 时间伪造定位,定位哪些视频的哪些时间段是被伪造过的。
- 图像伪造分类,包括双向(真实/伪造)、三向(真实/伪造与身份替换伪造方法/伪造与身份保留伪造方法)和 n 向(真实与 15 种伪造方法)分类。
- 空间伪造定位,与相应的真实图像相比,对伪造图像的操纵区域进行分割。
- 视频伪造分类,重新定义视频级伪造分类,并在随机位置上对帧进行处理。
该数据集由来自 SenseTime Research 、北京邮电大学、上海人工智能实验室、北京航空航天大学软件学院、中国科学技术大学和南洋理工大学 S-Lab 实验室的研究人员于 2021 年共同推出,相关论文成果为「ForgeryNet: A Versatile Benchmark for Comprehensive Forgery Analysis」。