
要約
最近、ディープフェイク(Deepfake)は、セキュリティ上の脅威や偽情報の拡散という点で多様な社会的懸念を引き起こしている。これに伴い、ディープフェイク検出に関する多くの研究が行われている。しかし、低品質および異なる品質レベルのディープフェイクを同時に効果的に検出するという課題は依然として深刻な問題である。既存の最先端(SOTA)手法の多くは、特定の品質レベルのディープフェイク検出に特化した単一モデルに依存しており、その制限が顕在化している。特に、動画品質に関する事前知識を用いて複数のモデルを構築するアプローチは、計算コストの増大に加え、モデルおよび学習データのオーバーヘッドが大きく、スケーラビリティや実世界への実装における実用性に欠ける。本研究では、異なる品質レベルのディープフェイクを効率的かつ同時に検出可能な「ユニバーサルなモデル内協調学習フレームワーク」を提案する。このアプローチは、品質に依存しないディープフェイク検出法として「QAD(Quality-Agnostic Deepfake Detection)」と命名する。具体的には、一般化誤差期待値の上限を観察した上で、ヒルベルト・シュミット独立基準(Hilbert-Schmidt Independence Criterion, HSIC)を用いて、異なる品質レベルからの画像の中間表現間の依存性を最大化する。さらに、画像の劣化に対してより頑健な性能を実現しつつ、全体的なモデル性能を向上させるために、「敵対的重み摂動モジュール」を考案した。7つの代表的なディープフェイクデータセットを用いた広範な実験により、本研究で提案するQADモデルが既存の最先端手法を上回る優れた性能を示したことが確認された。