11 天前

无需观看任何内容即可检测深度伪造

Tal Reiss, Bar Cavia, Yedid Hoshen
无需观看任何内容即可检测深度伪造
摘要

深度伪造攻击(Deepfake attacks)——即对包含人物的媒体内容进行恶意篡改——已成为社会面临的一项严峻挑战。传统的深度伪造检测方法通常依赖于监督学习分类器,旨在区分真实媒体与此前已知的深度伪造样本。然而,这类技术仅能识别与历史样本相似的伪造类型,无法有效应对零日(zero-day,即此前未见过)攻击。由于当前深度伪造生成技术发展迅猛,新型攻击手段层出不穷,这一局限性愈发凸显。我们的核心观察如下:i)在多数有效的深度伪造攻击中,伪造媒体往往伴随着虚假事实(false facts),即攻击者对人物的身份、言论、动作或外貌提出不实声明。例如,在伪造奥巴马(Obama)的视频时,攻击者会明确或隐含地宣称该视频内容为奥巴马本人;ii)现有的生成技术尚无法完美复现攻击者所声称的虚假事实。基于上述观察,我们引入“事实核查”(fact checking)的概念,该概念源自虚假新闻检测领域,用于识别零日深度伪造攻击。事实核查的核心在于验证所声称的事实(如“人物身份为奥巴马”)是否与实际观察到的媒体内容一致(如“该面部是否确实为奥巴马”),从而实现真实与伪造媒体的有效区分。由此,我们提出 FACTOR——一种面向深度伪造事实核查的实用化方案。该方法在关键攻击场景(如人脸替换与音视频同步合成)中展现出强大检测能力。尽管 FACTOR 不需要训练、完全依赖现成的通用特征,实现简单,且从未接触过任何深度伪造样本,仍取得了优于当前最先进水平的检测准确率。

无需观看任何内容即可检测深度伪造 | 最新论文 | HyperAI超神经