HyperAIHyperAI

Command Palette

Search for a command to run...

YOLO5Face:なぜ顔検出器を再発明するのか

Delong Qi Weijun Tan Qi Yao Jingfeng Liu

概要

近年、畳み込みニューラルネットワーク(CNN)を用いた顔検出技術において著しい進展が見られている。多くの顔検出器は顔検出に特化した設計を採用しているが、本研究では顔検出を一般的な物体検出タスクとして捉える。YOLOv5の物体検出器を基にした顔検出器を実装し、それを「YOLO5Face」と命名した。YOLOv5にいくつかの重要な改良を加え、顔検出に最適化した。主な改良点として、5点の顔ランドマーク回帰ヘッドの追加、バックボーン入力部へのステムブロック(stem block)の導入、SPP(Spatial Pyramid Pooling)における小サイズのカーネルの使用、およびPAN(Path Aggregation Network)ブロックにP6出力の追加を挙げられる。モデルサイズを異なるレベルで設計し、性能最適化のためのエクストララージモデルから、エッジデバイスやモバイルデバイスでのリアルタイム検出に適したスーパースモールモデルまでをカバーしている。WiderFaceデータセットにおける実験結果から、VGA画像において、ほぼすべてのEasy、Medium、Hardサブセットで最先端(SOTA)の性能を達成し、より複雑な専用顔検出器を上回ることが確認された。コードは以下のURLから公開されている:\url{https://github.com/deepcam-cn/yolov5-face}


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています