HyperAIHyperAI

Command Palette

Search for a command to run...

密集オブジェクト検出のためのフォーカス損失

概要

現在までに達成された最高の精度を誇る物体検出器は、R-CNNによって広く普及した二段階アプローチに基づいている。このアプローチでは、スパースな候補物体位置に対して分類器を適用する。これに対し、物体の可能性のある位置を規則的かつ密にサンプリングして適用する一段階検出器は、より高速かつ簡潔である可能性を秘めているが、これまでのところ二段階検出器の精度には及ばなかった。本論文では、この現象の原因を調査する。その結果、密な検出器の学習過程で生じる極端な前景-背景クラスの不均衡が中心的な要因であることが明らかになった。このクラス不均衡に対処するために、標準的な交差エントロピー損失を再設計し、正しく分類された例に割り当てられる損失を低減する手法を提案する。本研究で提唱する新たな損失関数であるFocal Lossは、学習を難易度の高い少数の例に集中させ、多数の容易な負例が学習過程で検出器を圧倒することを防ぐ。本損失関数の有効性を検証するため、単純な密サンプリング型検出器であるRetinaNetを設計・学習した。実験の結果、Focal Lossを用いて学習させたRetinaNetは、従来の一段階検出器と同等の速度を達成しつつ、既存のすべての最先端二段階検出器を上回る精度を実現した。コードは以下のURLから入手可能:https://github.com/facebookresearch/Detectron


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています