
摘要
深度信息在RGB-D显著性物体检测(SOD)中已被证明具有显著优势。然而,实际获取的深度图往往存在质量低、精度差的问题。现有的大多数RGB-D SOD模型在编码阶段缺乏跨模态交互,或仅存在从深度图到RGB图像的单向交互,这在面对低质量深度图时可能导致编码特征不准确。为解决这一局限性,本文提出在编码阶段尽早引入渐进式的双向交互机制,构建了一种新型的双向传递与选择网络——BTS-Net。该网络采用一组双向传递与选择(Bi-directional Transfer-and-Selection, BTS)模块,在特征编码过程中实现特征的精细化净化。基于所获得的鲁棒编码特征,本文进一步设计了一种高效轻量的分组解码器,以实现精确的最终显著性预测。在六个广泛使用的公开数据集上的大量实验表明,BTS-Net在四个关键评价指标上均超越了16种最新的先进方法,展现出卓越的性能。