SARDet-100K: 大規模SAR物体検出のオープンソースベンチマークとツールキットを目指して

合成開口レーダー(SAR)物体検出は、その全天候型の画像能力により最近注目を集めています。しかし、この研究分野では、公開データセットの不足(主に2,000枚未満の単一カテゴリ物体を含む)とソースコードへのアクセス困難という問題が存在しています。これらの課題に対処するため、我々は大規模なSAR物体検出用の新しいベンチマークデータセットとオープンソース手法を確立しました。当社のデータセット「SARDet-100K」は、10個の既存のSAR検出データセットを調査、収集、標準化することで作成されました。これにより、研究目的のために大規模かつ多様なデータセットが提供されます。当社の知る限り、「SARDet-100K」は初めてCOCOレベルの大規模マルチクラスSAR物体検出データセットとして作成されました。この高品質なデータセットを使用して、我々は包括的な実験を行い、SAR物体検出における重要な課題を明らかにしました:RGBデータセットでの事前学習とSARデータセットでの微調整との間で、データドメインとモデル構造の両面において大きな差異が存在することです。これらのギャップを埋めるために、我々は新たなマルチステージ・フィルターアグメンテーション(MSFA)事前学習フレームワークを提案します。このフレームワークは、データ入力、ドメイン移行、モデル移行の観点から問題に取り組みます。提案されたMSFA手法は、SAR物体検出モデルの性能を大幅に向上させるとともに、多様なモデル間で優れた汎化能力和らび柔軟性を示しています。本研究は、SAR物体検出分野におけるさらなる進歩に向けて道を開くことを目指しています。「SARDet-100K」のデータセットとコードは以下のURLで利用可能です:https://github.com/zcablii/SARDet_100K。