11日前

EGFNet:RGB–赤外線都市シーン解析のためのエッジ認識型ガイダンス統合ネットワーク

{Weiqing Yan, Caie Xu, WuJie Zhou, Shaohua Dong}
要約

都市シーン解析はスマート交通システムの核心技術であり、近年、コンピュータビジョン分野においてRGB–赤外線(熱画像)融合による都市シーン解析が注目を集めている。しかし、既存の多くの方針は予測マップにおける境界抽出性能が不十分であり、高レベル特徴の活用も十分でない。さらに、RGBと赤外線モダリティの特徴を単純に融合するのみで、包括的かつ効果的な特徴融合を実現できていない。こうした課題を解決するため、本研究ではRGB–赤外線都市シーン解析を目的としたエッジ感知型ガイド付き融合ネットワーク(Edge-aware Guidance Fusion Network, EGFNet)を提案する。まず、RGB画像と赤外線画像を用いて事前生成したエッジマップを導入し、予測マップ内の詳細な情報を捉え、そのエッジ情報を特徴マップに埋め込む。RGBと赤外線情報の効果的な融合を実現するため、十分なクロスモダリティ融合を保証するマルチモーダル融合モジュールを設計した。高レベルの意味的情報を重視し、グローバルかつ意味的特徴を抽出するためのモジュールを新たに提案した。デコード段階では、段階的な特徴融合に単純な要素毎の加算を採用した。さらに、解析精度の向上を図るため、セマンティックマップと境界マップの両方にマルチタスク深層監視(multitask deep supervision)を適用した。提案手法EGFNetの有効性を、標準ベンチマークデータセット上で広範な実験により検証し、最先端手法と比較して優れた性能を示した。