2ヶ月前
密集物体検出のためのFocal Loss
Lin, Tsung-Yi ; Goyal, Priya ; Girshick, Ross ; He, Kaiming ; Dollár, Piotr

要約
現在までの最高精度の物体検出器は、R-CNNによって普及した二段階アプローチに基づいています。この方法では、分類器が候補となる物体位置の疎集合に適用されます。一方、可能な物体位置を規則的に密集してサンプリングする一段階検出器は、より高速で単純である可能性がありますが、これまで二段階検出器の精度には及ばなかった。本論文では、その理由を調査します。我々は、訓練中に遭遇する密集検出器の極端な前景-背景クラスの不均衡が主因であることを発見しました。このクラス不均衡に対処するために、標準的なクロスエントロピー損失を再形成し、正しく分類された例の損失を軽減する手法を提案します。我々が提案する新しいFocal Loss(焦点損失)は、訓練中に多数の簡単な負例が検出器を圧倒することを防ぎつつ、難易度の高い少数の例に焦点を当てて訓練を行います。我々の損失関数の有効性を評価するために、RetinaNetと呼ぶシンプルな密集検出器を設計し訓練しました。結果は、Focal Lossを使用して訓練されたRetinaNetが以前の一段階検出器と同等以上の速度を持ちながら、既存の最先端二段階検出器を超える精度を達成できることを示しています。コードは以下のURLから入手できます: https://github.com/facebookresearch/Detectron。