リモートセンシング物体検出のための大規模選択的カーネルネットワーク

近年のリモートセンシングにおける物体検出に関する研究は、回転境界ボックス(oriented bounding boxes)の表現能力を向上させることに主眼を置いてきたが、リモートセンシング環境に特有の事前知識(prior knowledge)については十分に注目されていない。このような事前知識は、微小なリモートセンシング対象物が十分な長距離コンテキストを参照せずに誤検出される可能性があることから、有用であると考えられる。また、異なる種類の物体が要求する長距離コンテキストの範囲は異なり得る。本論文では、こうした事前知識を考慮し、大規模かつ選択的カーネル機構を有するネットワークである Large Selective Kernel Network(LSKNet)を提案する。LSKNetは、リモートセンシング環境におけるさまざまな物体の距離的コンテキストをより適切にモデル化できるよう、動的に大規模な空間受容野(spatial receptive field)を調整可能である。筆者らの知る限り、本研究はリモートセンシング物体検出分野において、大規模かつ選択的カーネル機構を初めて探求した初の試みである。装飾的な技術を用いずに、標準ベンチマークにおいても最新の最先端性能を達成しており、それぞれHRSC2016(98.46% mAP)、DOTA-v1.0(81.85% mAP)、FAIR1M-v1.0(47.87% mAP)で新たな記録を樹立した。同様の技術を応用した成果により、2022年度「大湾区国際アルゴリズムコンペティション」で2位を獲得した。コードは以下のURLから公開されている:https://github.com/zcablii/Large-Selective-Kernel-Network。