3ヶ月前

航空画像におけるロバストなオブジェクト検出のためのモデル相互作用を用いたアンカーの修正

Dong Liang, Qixiang Geng, Zongqi Wei, Dmitry A. Vorontsov, Ekaterina L. Kim, Mingqiang Wei, Huiyu Zhou
航空画像におけるロバストなオブジェクト検出のためのモデル相互作用を用いたアンカーの修正
要約

オブジェクト検出はコンピュータビジョン分野において著しい進展を遂げている。特に航空観測において、外観劣化を伴う小物体の検出は顕著な課題である。ヒューリスティックな学習のための十分な正例/負例サンプルを収集するため、多数のオブジェクト検出器は、正解データとの交差率(Intersection-over-Union, IoU)を計算するために事前に領域アンカー(region anchors)を設定している。しかし、このような手法では小物体が頻繁に無視されたり、誤分類されたりする。本論文では、新たなトレーニングサンプル生成器を構築するための効果的な動的強化アンカー(Dynamic Enhancement Anchor, DEA)ネットワークを提案する。従来の最先端技術とは異なり、本手法はアンカーに基づくユニットとアンカーに依存しないユニットの間で相互にサンプルをスクリーニングするためのサンプルディスクリミネーターを活用し、適切なサンプルを生成する。さらに、保守的なアンカーに基づく推論スキームを用いたマルチタスク連合学習により、モデルの性能を向上させつつ、計算量を低減する。本手法は回転方向対応および水平方向のオブジェクト検出の両タスクをサポートしている。DotaおよびHRSC2016という2つの困難な航空画像ベンチマークにおける広範な実験結果から、本手法は中程度の推論速度およびトレーニング時の計算負荷で、精度面で最先端の性能を達成することが示された。Dotaデータセットにおいて、RoI-Transformerをベースラインとして採用したDEA-Netは、より弱いバックボーンネットワーク(ResNet-101 vs ResNet-152)を用いて回転物体検出で先進的手法を0.40%の平均精度(mAP)上回り、同じバックボーンを用いて水平物体検出では3.08%のmAP向上を達成した。また、ReDetをベースラインとしたDEA-Netは、80.37%という最先端の性能を達成した。HRSC2016データセットでは、わずか3つの水平アンカーのみを用いて、以前の最良モデルを1.1%のmAP向上で上回った。