17日前

階層的動的フィルタリングネットワークによるRGB-D顕著オブジェクト検出

Youwei Pang, Lihe Zhang, Xiaoqi Zhao, Huchuan Lu
階層的動的フィルタリングネットワークによるRGB-D顕著オブジェクト検出
要約

RGB-D顕著オブジェクト検出(SOD)の主な目的は、クロスモーダル融合情報のより良い統合と活用である。本論文では、この問題に新たな視点からアプローチする。我々は、密結合構造を用いて異なるモーダルの特徴を統合し、その混合特徴を活用して受容野のサイズが異なる動的フィルタを生成する。最終的に、より柔軟かつ効率的なマルチスケールクロスモーダル特徴処理を実現する「動的拡張ピラミッドモジュール」を提案する。予測結果のエッジをより鋭く、顕著領域を一貫性を持たせるために、ハイブリッド強化損失関数を設計し、結果のさらなる最適化を図った。この損失関数は、単一モーダルのRGB SODタスクにおいても有効であることが実証された。8つの挑戦的なベンチマークデータセットにおいて、6つの評価指標において、提案手法は既存の12種類の手法を上回った。多数の実験により、提案モジュールおよび損失関数の有効性が確認された。本研究のコード、モデル、および結果は、\url{https://github.com/lartpang/HDFNet} で公開されている。

階層的動的フィルタリングネットワークによるRGB-D顕著オブジェクト検出 | 最新論文 | HyperAI超神経