
摘要
显著性物体检测(Salient Object Detection, SOD)中,复杂的背景以及物体与其周围环境在外观上的相似性通常被视为具有挑战性的场景。为此,研究者自然地将传统的RGB图像之外的深度信息引入作为输入,形成了RGB-D SOD或称为深度感知SOD的新范式。然而,这一新兴研究方向在很大程度上受到原始深度图像中普遍存在的噪声与语义模糊性问题的制约。为应对上述挑战,本文提出一种深度校准与融合(Depth Calibration and Fusion, DCF)框架,包含两个创新性组件:1)一种学习策略,用于校准原始深度图中的潜在偏差,以提升SOD性能;2)一种简洁而高效的跨模态参考模块,用于融合RGB与深度模态的特征。大量实验结果表明,所提方法在27种当前最先进的SOD方法中表现卓越,显著优于现有方法。此外,所提出的深度校准策略作为预处理步骤,可无缝集成至现有的前沿RGB-D SOD模型中,并带来显著的性能提升。