11日前

RGB-D顕著オブジェクト検出のための分岐型バックボーン戦略

Yingjie Zhai, Deng-Ping Fan, Jufeng Yang, Ali Borji, Ling Shao, Junwei Han, Liang Wang
RGB-D顕著オブジェクト検出のための分岐型バックボーン戦略
要約

マルチレベル特徴の統合はコンピュータビジョンにおける基本的な課題であり、さまざまなスケールでのオブジェクト検出、セグメンテーション、分類に活用されてきた。マルチレベル特徴がマルチモーダルな情報と融合する場合、最適な特徴集約およびマルチモーダル学習戦略の設計は依然として困難な課題となっている。本論文では、RGB-D顕著オブジェクト検出の内在的なマルチモーダル性とマルチレベル性を活かし、新たな段階的精緻化ネットワークを提案する。具体的には、まず二分型バックボーン戦略(BBS: Bifurcated Backbone Strategy)を用いて、マルチレベル特徴を「教師」用と「学生」用の特徴に再構成する手法を提案する。次に、チャネルおよび空間的視点から情報量の多い深度情報(depth cues)を抽出するための深度強化モジュール(DEM: Depth-Enhanced Module)を導入し、RGBと深度のモダリティを補完的に融合する。本研究で提案するアーキテクチャは、Bifurcated Backbone Strategy Network(BBS-Net)と命名され、構造が単純かつ効率的であり、バックボーンモデルに依存しない特徴を持つ。広範な実験により、BBS-Netは5つの評価指標に基づき、8つの難易度の高いデータセットにおいて18の最先端(SOTA)モデルを顕著に上回ることを示した。特に、S-measureにおいてトップモデル(DMRA-iccv2019)と比較して約4%の性能向上を達成した。さらに、異なるRGB-Dデータセットの一般化能力について包括的な分析を行い、今後の研究を支援する強力なトレーニングデータセットを提供している。

RGB-D顕著オブジェクト検出のための分岐型バックボーン戦略 | 最新論文 | HyperAI超神経