2ヶ月前

深層学習された顔表現は疎であり、選択性が高く、堅牢である。

Yi Sun; Xiaogang Wang; Xiaoou Tang
深層学習された顔表現は疎であり、選択性が高く、堅牢である。
要約

本論文では、顔認識用の高性能な深層畳み込みネットワーク(DeepID2+)を設計しています。このネットワークは、識別-検証の監督信号を使用して学習されます。隠れ表現の次元を増やし、初期の畳み込み層に監督を加えることで、DeepID2+はLFWおよびYouTube Facesベンチマークで新たな最先端の性能を達成しました。経験的な研究を通じて、その深層ニューラルアクティベーションが高パフォーマンスに重要な3つの特性:疎性、選択性、堅牢性を発見しました。(1) ニューロンのアクティベーションが適度に疎であることが観察されました。適度な疎性は深層ネットワークの識別力を最大化するとともに、画像間の距離も最大化します。驚くことに、ニューロン応答がバイナリ化された後でもDeepID2+は高い認識精度を達成できます。(2) 高い層にあるニューロンはアイデンティティとアイデンティティに関連する属性に対して非常に選択的です。異なるアイデンティティや属性が存在する場合、常に興奮または抑制される異なるサブセットのニューロンを特定することができます。DeepID2+は訓練中に属性を区別することを教えられていないにもかかわらず、このような高レベルな概念を暗黙的に学習しています。(3) トレーニングセットにはオクルージョンパターンが含まれていないにもかかわらず、DeepID2+はオクルージョンに対して遥かに堅牢です。

深層学習された顔表現は疎であり、選択性が高く、堅牢である。 | 最新論文 | HyperAI超神経