2ヶ月前

空中画像における向きを持つ物体検出のためのRoIトランスフォーマーの学習

Jian Ding; Nan Xue; Yang Long; Gui-Song Xia; Qikai Lu
空中画像における向きを持つ物体検出のためのRoIトランスフォーマーの学習
要約

空中画像における物体検出は、鳥瞰視点、複雑な背景、および物体の多様な外観のため、コンピュータビジョンにおいて活発かつ困難な課題となっています。特に、空中画像で密集した物体を検出する際には、一般的な物体検出に使用される水平提案手法が、興味領域(Region of Interests: RoIs)と物体との間で不一致を引き起こすことがよくあります。これにより、最終的な物体分類の信頼度と位置特定の精度との間に一般的なずれが生じます。回転アンカーを使用することでこの問題に対処しようとする試みがありますが、その設計は常にアンカーの数を増やし、計算量を大幅に増加させてしまいます。本論文では、これらの問題を解決するためにRoIトランスフォーマーを提案します。具体的には、領域提案の品質向上のために、まず水平興味領域(Horizontal Region of Interest: HRoI)を回転興味領域(Rotated Region of Interest: RRoI)に変換するRRoI学習器を設計しました。RRoIsに基づいて、次に回転不変特徴量を抽出してその後の分類と回帰を強化するための回転位置感応RoIアライン(Rotated Position Sensitive RoI Align: RPS-RoI-Align)モジュールを提案しました。私たちのRoIトランスフォーマーは軽量であり、向き付き物体検出器に簡単に組み込むことができます。RoIトランスフォーマーの単純な実装は、DOTAおよびHRSC2016という2つの一般的で挑戦的な空中データセットにおいて最先端の性能を達成しており、検出速度への影響はほとんどありませんでした。また、向き付きバウンディングボックス注釈が利用可能な場合、私たちのRoIトランスフォーマーは変形位置感応RoIプーリングを超える性能を示しています。広範囲にわたる実験により、私たちのRoIトランスフォーマーの柔軟性と効果が確認されました。結果は他の検出器アーキテクチャとの容易な統合可能性と性能向上への寄与を明確に示しています。