11日前

MogFace:顔検出におけるより深い理解へ向けて

Yang Liu, Fei Wang, Jiankang Deng, Zhipeng Zhou, Baigui Sun, Hao Li
MogFace:顔検出におけるより深い理解へ向けて
要約

汎用物体検出器の先駆的設計の恩恵を受け、顔検出分野では著しい進展が達成されている。一般的に、顔検出器におけるバックボーン、特徴ピラミッド層、検出ヘッドモジュールのアーキテクチャは、すべて汎用物体検出器から得られた優れた経験を統合している。しかし、ラベル割り当てやスケールレベルのデータ拡張戦略といったいくつかの有効な手法は、顔検出器に直接適用した場合、一貫した優位性を維持できない。具体的には、前者の戦略は膨大なハイパーパラメータを必要とし、後者の戦略は異なる検出タスク間におけるスケール分布バイアスという課題に直面しており、これらはいずれも一般化能力の制限要因となっている。さらに、顔関連の下流タスクに正確な顔バウンディングボックスを提供するため、顔検出器は誤検出(フェイルアラーム)の排除が不可欠である。したがって、ラベル割り当て、スケールレベルのデータ拡張、および誤検出の低減に関する実用的な解決策の開発が、顔検出器の性能向上に不可欠である。本論文では、従来手法が困難とされている上記の3つの課題に着目し、新規の顔検出器「MogFace」を提案する。本研究で提唱するMogFaceでは、性能向上を図るため、以下の3つの鍵となるモジュールをそれぞれ独立して設計した:適応的オンライン増分型アノンマイニング戦略(Adaptive Online Incremental Anchor Mining Strategy)、選択的スケール強化戦略(Selective Scale Enhancement Strategy)、階層的コンテキスト認識モジュール(Hierarchical Context-Aware Module)。最終的に、我々の知る限り、MogFaceはWider Faceリーダーボードにおいて最良の顔検出器であり、あらゆるテストシナリオで全てのカテゴリで首位を獲得している。実装コードは以下のURLから公開されている:\url{https://github.com/damo-cv/MogFace}。

MogFace:顔検出におけるより深い理解へ向けて | 最新論文 | HyperAI超神経