HyperAIHyperAI

Command Palette

Search for a command to run...

エンコーダ-デコーダ型CNNのカスケード構造と学習可能な座標回帰器を用いた頑健な顔面ランドマーク検出

Luis Baumela Jose M. Buenaposada Roberto Valle

概要

畳み込みニューラルネットワーク(CNN)は、多くのコンピュータビジョン問題において標準的な技術として定着している。顔のランドマーク検出に用いられるCNNは非常に頑健であるものの、制約のない条件下で取得された画像を処理する際には依然として精度に課題を抱えている。本研究では、ランドマークの推定精度を向上させるために、ニューラルネット回帰器のカスケード構造を活用する手法を検討する。具体的には、同一のアーキテクチャを持つ2つのエンコーダデコーダ型CNNを連結する。最初のネットワークは、ランドマーク位置の粗い推定値をもつヒートマップ群を出力する。2番目のネットワークは、合成的に生成された遮蔽状況を用いて訓練され、曖昧または遮蔽されたランドマークの位置を精緻に修正する。最後に、すべてのヒートマップ間で重みを共有する密結合層を用いて、ランドマーク座標を高精度で回帰する。提案手法は、広く最も挑戦的な公開データセットとして知られる300W、COFW、WFLWにおいて、最先端の性能を達成した。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています