Command Palette
Search for a command to run...
FaceNet:顔認識およびクラスタリングのための統一埋め込み
FaceNet:顔認識およびクラスタリングのための統一埋め込み
Schroff Florian Kalenichenko Dmitry Philbin James
概要
顔認識分野における近年の顕著な進展にもかかわらず、大規模な環境において顔の検証および認識を効率的に行うことは、現行のアプローチにとって依然として大きな課題である。本論文では、顔画像をコンパクトなユークリッド空間へ直接写像するシステム「FaceNet」を提案する。この空間では、距離が顔の類似度を直接表すよう設計されており、空間が生成されれば、顔認識、検証、クラスタリングといったタスクは、FaceNetの埋め込み表現(embedding)を特徴ベクトルとして用いることで、標準的な手法により容易に実装可能となる。本手法は、従来の深層学習アプローチが中間のボトルネック層を最適化するのではなく、埋め込みそのものを直接最適化するための深層畳み込みネットワークを用いる。訓練には、新規のオンライントリプレットマイニング法により生成された概ね整列された一致/非一致の顔領域ペアを用いたトリプレットを採用する。本アプローチの利点は、顔認識における表現効率の大幅な向上にある。1顔あたりわずか128バイトのメモリで、最先端の顔認識性能を達成している。広く用いられている「Labeled Faces in the Wild(LFW)」データセットにおいて、本システムは99.63%という新たな記録精度を達成した。YouTube Faces DBでは95.12%の精度を記録した。両データセットにおいて、これまでに発表された最高性能と比較して、誤差率を30%低減した。さらに本研究では「調和的埋め込み(harmonic embeddings)」および「調和的トリプレット損失(harmonic triplet loss)」という概念を導入した。これらは、異なるネットワークによって生成された顔埋め込みの異なるバージョンが互換性を持ち、互いに直接比較可能となるような仕組みを定義している。