2ヶ月前

カスケード R-CNN: 高品質な物体検出への深堀

Zhaowei Cai; Nuno Vasconcelos
カスケード R-CNN: 高品質な物体検出への深堀
要約

物体検出においては、 Intersection over Union (IoU) の閾値を設定して正例と負例を定義する必要があります。IoUの閾値が低い(例えば0.5)状態で訓練された物体検出器は、通常、雑音のある検出結果を生成します。しかし、IoUの閾値を上げると検出性能が低下する傾向があります。この現象の主な原因は2つあります:1) 正例サンプルが指数関数的に減少することによる訓練時の過学習、および2) 推論時に最適化された検出器のIoUと入力仮説のIoUとの間の不一致です。これらの問題に対処するために、多段階物体検出アーキテクチャであるCascade R-CNNが提案されています。このアーキテクチャは、IoUの閾値を段階的に上げて訓練される一連の検出器から構成されており、近接した偽陽性に対する選択性を段階的に高めていきます。各検出器は段階的に訓練され、前の検出器の出力が次のより高品質な検出器の訓練に適した分布であるという観察に基づいています。逐次改善された仮説の再サンプリングにより、すべての検出器が同等サイズの正例セットを持つことが保証され、過学習問題が軽減されます。推論時にも同じカスケード手順が適用され、各段階での検出器品質と仮説との間の一貫性が向上します。Cascade R-CNNの単純な実装は、挑戦的なCOCOデータセット上で全ての単一モデル物体検出器を超える性能を示しています。実験では、Cascade R-CNNが異なる検出器アーキテクチャに対して広く適用可能であり、ベースライン検出器の強さに関係なく一貫した性能向上を達成することが確認されています。コードは https://github.com/zhaoweicai/cascade-rcnn で公開予定です。

カスケード R-CNN: 高品質な物体検出への深堀 | 最新論文 | HyperAI超神経