2ヶ月前

野生環境における深層学習による顔属性の解析

Liu, Ziwei ; Luo, Ping ; Wang, Xiaogang ; Tang, Xiaoou
野生環境における深層学習による顔属性の解析
要約

野生環境での顔属性の予測は、複雑な顔の変動により困難を伴います。本研究では、野生環境における属性予測に向けた新しい深層学習フレームワークを提案します。このフレームワークは、2つのCNN(LNetとANet)を連携させています。これらのネットワークは属性タグとともに共同で微調整されますが、事前学習方法は異なります。LNetは大量の一般的な物体カテゴリを使用して顔位置特定のために事前学習され、ANetは大量の顔識別データを使用して属性予測のために事前学習されます。このフレームワークは以下の点で現行の最先端技術を大幅に上回り、顔表現の学習に関する重要な事実も明らかにしています。異なる事前学習戦略によって、顔位置特定(LNet)と属性予測(ANet)の性能がどのように向上するかを示しています。LNetのフィルターが画像レベルの属性タグのみで微調整されているにもかかわらず、全体的な画像に対する応答マップが顔位置を強く示していることを明らかにしています。この事実は、すべての属性認識作業で必要とされる顔バウンディングボックスやランドマークなしで、画像レベルの注釈のみを使用してLNetを顔位置特定のために訓練できることを可能にします。ANetが大量の顔識別データによる事前学習後、高次の中間層ニューロンが自動的に意味的な概念を見出していることを示しています。そして、属性タグによる微調整後にはこれらの概念が大幅に豊富になることが確認されています。各属性はこれらの概念の疎な線形結合によって十分に説明できます。