12日前

リアルタイム速度における正確な顔画像解析

{Hefei Ling, Yao Sun, Si Liu, Zhen Wei}
要約

本稿では、顔解析(face parsing)タスクにおいて高い精度とリアルタイム推論速度を実現する深層学習ネットワークの設計方針を提案する。一般的な画像解析タスクと顔解析タスクの相違点を分析した上で、まず従来のFCN(Fully Convolutional Network)の構造を再検討し、顔解析タスク特有の性質に適応するための改良を加えた。特に、ネットワーク設計の新たな知見を提供するため、「正規化受容field(Normalized Receptive Field)」という概念を提唱した。次に、より豊かな文脈情報を統合し、学習過程における特徴の正則化を実現する新しい損失関数である「統計的文脈損失(Statistical Contextual Loss)」を導入した。さらにモデルの高速化を図るため、軽量なネットワークへ学習された知識を効果的に転送する半教師付き蒸留(semi-supervised distillation)スキームを提案した。LFWおよびHelenデータセットにおける広範な実験結果から、新設計方針が効果性および効率性の両面で顕著な優位性を示すことが実証された。

リアルタイム速度における正確な顔画像解析 | 最新論文 | HyperAI超神経