2ヶ月前

SCAResNet: 送電塔における小さな物体検出向けに最適化されたResNetの変種

Li, Weile ; Shi, Muqing ; Hong, Zhonghua
SCAResNet: 送電塔における小さな物体検出向けに最適化されたResNetの変種
要約

従来の深層学習に基づく物体検出ネットワークでは、データ前処理段階で画像をリサイズすることがよく行われ、特徴マップでの一様なサイズとスケールを実現しています。リサイズはモデルの伝播と完全結合分類を容易にするために行われますが、これにより物体の変形や画像内の貴重な情報の損失が避けられません。この欠点は、線形状でピクセル数が少ない配電塔などの小さな物体に対して特に顕著になります。この問題に対処するため、我々はリサイズ操作を放棄することを提案します。代わりに、位置エンコーディング付きマルチヘッド・クリス・クロス注意(Positional-Encoding Multi-head Criss-Cross Attention)を導入します。これにより、モデルは文脈情報を捉え、複数の表現部分空間から学習し、配電塔の意味論的内容を効果的に豊かにすることができます。さらに、空間ピラミッドプーリング(Spatial Pyramid Pooling)を強化するために、3つのプーリングされた特徴マップを新しい統一されたものに再整形し、計算負荷も軽減します。この手法により、異なるサイズやスケールの画像でも一様な次元を持つ特徴マップを生成でき、特徴マップの伝播にも利用できます。我々のSCAResNetはこれらの改善点をバックボーンネットワークであるResNetに組み込んでいます。Duke大学が提供する電力送配電インフラ画像データセットを使用してSCAResNetの評価を行いました。追加的なテクニックなしで、ガウシアン受容野ベースのラベル割り当てを使用したさまざまな物体検出モデルを基準として用いました。基準モデルにSCAResNetを取り入れた際にはmAPが2.1%向上しました。これは我々のSCAResNetが送配電塔の検出において優れていることを示しており、小さな物体検出におけるその価値も証明しています。ソースコードは以下のURLから入手可能です: https://github.com/LisavilaLee/SCAResNet_mmdet.

SCAResNet: 送電塔における小さな物体検出向けに最適化されたResNetの変種 | 最新論文 | HyperAI超神経