11日前
BTS-Net:RGB-D顕著対象検出のための双方向トランスファー・セレクションネットワーク
Wenbo Zhang, Yao Jiang, Keren Fu, Qijun Zhao

要約
RGB-D顕著対象検出(SOD)において、深度情報の活用が有効であることが実証されている。しかし、取得される深度マップはしばしば低品質で不正確である。既存の大多数のRGB-D SODモデルは、エンコーダ段階においてクロスモーダル相互作用を実装しておらず、あるいは深度からRGBへの単方向的な相互作用しか持たないため、低品質な深度情報に対してはエンコーダ特徴が不正確になる可能性がある。この課題を解決するため、本研究ではエンコーダ段階の初期段階から段階的で双方向の相互作用を導入することを提案し、新たな双方向転送・選択ネットワーク(BTS-Net)を構築した。BTS-Netは、エンコーディング過程において特徴を精査・洗練するための双方向転送・選択(BTS)モジュール群を採用している。得られた堅牢なエンコーダ特徴を基に、高精度な最終的な顕著性予測を実現するため、効果的かつ軽量なグループデコーダも設計した。6つの広く用いられているデータセットにおける包括的な実験により、BTS-Netが4つの主要評価指標において、16の最新の最先端手法を上回ることが確認された。