要約
制約のない環境における顔認識は、継続的な研究課題である。ポーズや低解像度といった顔認識の変動要因は、すでに広く注目されているが、「装飾(ディスガイズ)」は顔認識において特に困難な要因とされている。その主な理由の一つは、大規模かつ代表的なラベル付きデータベースの不足に加え、このような環境下で複数の変動要因に対応できる効果的なアルゴリズムが不足していることにある。本稿では、ディスガイズが存在する状況における顔認識の課題に対処するため、A2-LINKと呼ばれるアクティブラーニングフレームワークを提案する。A2-LINKは、顔認識用の機械学習モデルを出発点とし、ターゲットドメインからラベル付けが行われる訓練サンプルを知的に選択する。さらに、敵対的ノイズを含むハイブリッドノイズを用いてモデルを微調整し、ディスガイズがある場合とない場合の両方で良好な性能を発揮するモデルを構築する。実験結果から、LCSSE、ArcFace、DenseNetといった最先端の深層学習特徴抽出モデルを用いた場合でも、DFWおよびDFW2019データセットにおいて本フレームワークの有効性と汎化能力が確認された。