11日前

YOLO5Face:なぜ顔検出器を再発明するのか

Delong Qi, Weijun Tan, Qi Yao, Jingfeng Liu
YOLO5Face:なぜ顔検出器を再発明するのか
要約

近年、畳み込みニューラルネットワーク(CNN)を用いた顔検出技術において著しい進展が見られている。多くの顔検出器は顔検出に特化した設計を採用しているが、本研究では顔検出を一般的な物体検出タスクとして捉える。YOLOv5の物体検出器を基にした顔検出器を実装し、それを「YOLO5Face」と命名した。YOLOv5にいくつかの重要な改良を加え、顔検出に最適化した。主な改良点として、5点の顔ランドマーク回帰ヘッドの追加、バックボーン入力部へのステムブロック(stem block)の導入、SPP(Spatial Pyramid Pooling)における小サイズのカーネルの使用、およびPAN(Path Aggregation Network)ブロックにP6出力の追加を挙げられる。モデルサイズを異なるレベルで設計し、性能最適化のためのエクストララージモデルから、エッジデバイスやモバイルデバイスでのリアルタイム検出に適したスーパースモールモデルまでをカバーしている。WiderFaceデータセットにおける実験結果から、VGA画像において、ほぼすべてのEasy、Medium、Hardサブセットで最先端(SOTA)の性能を達成し、より複雑な専用顔検出器を上回ることが確認された。コードは以下のURLから公開されている:\url{https://github.com/deepcam-cn/yolov5-face}

YOLO5Face:なぜ顔検出器を再発明するのか | 最新論文 | HyperAI超神経