
要約
マルチスペクトル画像ペアは補完的な視覚情報を提供するため、歩行者検出システムの堅牢性と信頼性を向上させます。RGBと赤外線熱画像(thermal IR)モダリティの双方の利点を活かすために、本研究では新たな注目型マルチスペクトル特徴融合手法を提案します。モダリティ間およびモダリティ内における注目モジュールの指導のもと、深層学習アーキテクチャはマルチスペクトル特徴の動的重み付けと融合を学習します。公開されている2つのマルチスペクトル物体検出データセットを用いた実験により、提案手法が計算コストを低く抑えつつ、検出精度を顕著に向上させることを確認しました。