
要約
RGBD画像における顕著対象検出(SOD)において、深度センサの広範な利用可能性は、貴重な補完的情報を提供している。しかし、RGB情報と深度情報の本質的な違いのため、ImageNetで事前学習されたバックボーンモデルを用いて深度チャネルから特徴を抽出し、それをRGB特徴と直接統合する手法は最適ではない。本研究では、従来の深層学習を用いないSOD手法において主要な手がかりとして用いられていた「対比先行情報(contrast prior)」を、CNNベースのアーキテクチャに導入することで、深度情報の強化を図っている。強化された深度情報は、新たな「流動的ピラミッド統合(fluid pyramid integration)」を用いてRGB特徴と統合され、マルチスケールのクロスモーダル特徴をより効果的に活用できるようにしている。5つの挑戦的なベンチマークデータセットにおける包括的な実験結果から、本研究で提案するCPFPアーキテクチャが、9つの最先端手法を上回る優れた性能を示すことが確認された。