
要約
ヒートマップ回帰を用いた深層ネットワークは、顔のランドマークを局在化するための主流的な手法の一つとなっています。しかし、ヒートマップ回帰の損失関数に関する研究はほとんど行われていません。本論文では、顔アライメント問題における理想的な損失関数の特性を分析し、異なるタイプの真値ヒートマップピクセルに形状を適応させる新しい損失関数である「アダプティブ・ウイング損失」(Adaptive Wing loss)を提案します。この適応性により、前景ピクセルに対してより大きな損失が課され、背景ピクセルに対しては少ない損失が課されます。前景と背景ピクセル間の不均衡に対処するために、「重み付き損失マップ」(Weighted Loss Map)も提案します。これは、前景および難しい背景ピクセルに高い重みを割り当てることで、学習過程がランドマーク局在化にとって重要なピク塞尔に焦点を当てるのに役立ちます。さらに顔アライメントの精度向上のために、境界予測と境界座標を使用したCoordConvを導入します。COFW、300W、WFLWなどの異なるベンチマークでの広範な実験結果から、我々の手法は様々な評価指標において既存の最先端技術を大幅に上回ることが示されました。また、アダプティブ・ウイング損失は他のヒートマップ回帰タスクにも貢献しています。コードは https://github.com/protossw512/AdaptiveWingLoss で公開される予定です。