Command Palette
Search for a command to run...
SARATR-X:SARターゲット認識のためのファウンデーションモデル構築に向けて
SARATR-X:SARターゲット認識のためのファウンデーションモデル構築に向けて
Weijie Li Wei Yang Yuenan Hou Li Liu Yongxiang Liu Xiang Li
概要
合成開口レーダー自動ターゲット認識(SAR ATR)分野において、顕著な進展が見られつつあるものの、近年の研究は、車両、船舶、航空機、建物など特定のカテゴリに焦点を当てたターゲット検出および分類に集中している。現在の最先端SAR ATR手法の根本的な制約の一つは、教師あり学習(supervised learning)、タスク特化型、カテゴリ数に制限のある、閉世界学習(closed-world learning)という学習枠組みに依存している点である。この枠組みは、専門のSARアナリストによって高コストで正確にラベル付けされた大量のデータに依存しており、汎化能力およびスケーラビリティに限界がある。本研究では、SAR ATR向けの基礎モデル(foundation model)の構築に初めて挑戦し、SARATR-Xと命名した。SARATR-Xは自己教師あり学習(self-supervised learning, SSL)を通じて汎化可能な表現を学習し、ラベル効率的なモデル適応を可能にすることで、汎用的なSARターゲット検出および分類タスクへの基盤を提供する。具体的には、SARATR-Xは、最新のベンチマークを統合して収集した0.18MのラベルなしSARターゲットサンプルを用いて学習されており、現在までに公開されている最大規模のデータセットとなっている。SAR画像の特徴を考慮し、SAR ATRに特化したバックボーンネットワークを慎重に設計し、多スケール勾配特徴を有する二段階の自己教師あり学習法を採用することで、特徴の多様性およびモデルのスケーラビリティを確保した。SARATR-Xの性能は、少サンプル学習(few-shot)およびロバスト性設定における分類、および複数カテゴリ・複数シーンにわたる検出タスクにおいて評価された結果、従来の完全教師あり、半教師あり、自己教師あり手法と比較しても、しばしば同等あるいは優れた性能を達成した。本研究で開発したSARATR-Xおよび収集・整備したデータセットは、https://github.com/waterdisappear/SARATR-X にて公開され、SAR画像解釈における基礎モデル研究の促進を目的としている。