7日前

マルチチャネル畳み込みニューラルネットワークを用いた顔のプレゼンテーション攻撃検出のための1クラス表現学習

Anjith George, Sebastien Marcel
マルチチャネル畳み込みニューラルネットワークを用いた顔のプレゼンテーション攻撃検出のための1クラス表現学習
要約

顔認識は広く用いられるバイオメトリクスモダリティとして進化を遂げている。しかし、提示攻撃(presentation attacks)に対して脆弱であることが、重大なセキュリティ上の脅威となっている。提示攻撃検出(Presentation Attack Detection: PAD)手法はこの問題に対処しようとしているが、未観測の攻撃に対して一般化できないことがしばしば見られる。本研究では、一クラス分類器を用いた新しいPADフレームワークを提案する。この手法では、マルチチャネル畳み込みニューラルネットワーク(Multi-Channel Convolutional Neural Network: MCCNN)を用いて特徴表現を学習する。さらに、新たな損失関数を導入することで、本物(bonafide)クラスの表現を凝縮(compact)させる一方で、攻撃の表現から遠く離れるようにネットワークを学習させる。その後、得られた埋め込み表現に対して、一クラスガウス混合モデル(one-class Gaussian Mixture Model)を適用し、PADタスクを実行する。本フレームワークは、本物データおよび既知の攻撃クラスからのみ学習することで、堅牢なPADシステムを構築する新しいアプローチを提供する。これは、本物データや比較的単純な攻撃データの収集は、多様で高コストな攻撃データの収集に比べてはるかに容易であるため、特に重要である。提案手法は、2Dおよび3D攻撃の多様な種類を含む公開データベースであるWMCAマルチチャネル顔PADデータベースを用いて評価された。さらに、RGBチャネルのみを用いたMLFPおよびSiW-Mデータセットを用いた実験も実施した。未観測攻撃プロトコルにおいて優れた性能が示されたことから、本手法の有効性が確認された。結果の再現に必要なソフトウェア、データ、プロトコルはすべて公開されている。