16日前

時系列一貫性を活用したより汎用的なビデオ顔偽造検出の探求

Yinglin Zheng, Jianmin Bao, Dong Chen, Ming Zeng, Fang Wen
時系列一貫性を活用したより汎用的なビデオ顔偽造検出の探求
要約

現在の顔操作技術は、品質および制御性の面で顕著な成果を上げているものの、時間的に一貫した顔映像の生成には依然として課題を抱えている。本研究では、動画顔偽造検出において時間的整合性を最大限に活用する可能性を検討する。これを実現するため、二段階構成の新規エンドツーエンドフレームワークを提案する。第一段階は、完全な時間的畳み込みネットワーク(FTCN)である。FTCNの鍵となる洞察は、空間畳み込みカーネルサイズを1に縮小しつつ、時間的畳み込みカーネルサイズを維持することにある。驚くべきことに、この特異な設計により、モデルが時間的特徴を効果的に抽出できるだけでなく、汎化能力の向上も見られた。第二段階は、長期的な時間的整合性を探索することを目的とした時間的トランスフォーマー(Temporal Transformer)ネットワークである。提案するフレームワークは汎用性と柔軟性に富み、事前学習モデルや外部データセットを用いずに、完全にスクラッチから直接学習可能である。広範な実験の結果、本フレームワークは既存手法を上回る性能を示し、新たな種類の顔偽造動画に対しても効果的に適用可能であることが確認された。

時系列一貫性を活用したより汎用的なビデオ顔偽造検出の探求 | 最新論文 | HyperAI超神経