マルチモーダルリモートセンシング画像におけるオブジェクト検出のためのガイド付きハイブリッド量子化:一対一自己教師学習による手法

計算量の複雑性を考慮し、本研究では「1対1自己指導付きガイド付きハイブリッド量子化(GHOST)」フレームワークを提案する。具体的には、まず、量子化と知識蒸留の協調作用により軽量化を実現するという革新的なアイデアに基づき、「ガイド付き量子化自己蒸留(GQSD)」と呼ばれる構造を設計した。この手法では、精度の高い全精度モデル(teacher)が量子化モデル(student)の学習をガイドすることで、事前に巨大な事前学習モデルを用意する必要がなく、時間とコストの両面で効率的である。第二に、重み値探索空間において中心点とサンプル間の分布距離に対する閾値を適用した制約条件下で、最適なビット幅を自動的に探索可能な「ハイブリッド量子化(HQ)」モジュールを提案した。第三に、情報伝達の効率を向上させるため、学生ネットワークに自己判断能力を付与する「1対1自己指導(OST)」モジュールを導入した。このモジュールでは、同一位置に存在する学生ネットワークと教師ネットワークの間に「スイッチ制御機械(SCM)」を設け、教師の誤った指導を低減しつつ、重要な知識を学生に伝達する役割を果たす。この知識蒸留法により、追加の教師データや監視信号を一切用いずに、モデルが自己学習を行い、顕著な性能向上を達成することが可能となる。Vedio Aerial Image Dataset(VEDAI)を含む多モーダルデータセットおよび単モーダルデータセット(DOTA、NWPU、DIOR)における広範な実験により、GHOSTを用いた物体検出が既存の検出器を上回ることを示した。また、リモートセンシング用・軽量・知識蒸留ベースのアルゴリズムと比較して、パラメータ数が9.7 MB未満、ビット演算量(BOPs)が2158 G未満という極めて軽量な設計を実現しており、軽量化分野における優位性を示している。本研究のコードおよびモデルは、https://github.com/icey-zhang/GHOST にて公開される予定である。