Kalibrierte RGB-D saliente Objektdetektion

Komplexe Hintergründe sowie ähnliche Erscheinungsformen zwischen Objekten und ihrer Umgebung gelten allgemein als herausfordernde Szenarien im Bereich der auffälligen Objektdetektion (Salient Object Detection, SOD). Dies führt naturgemäß zur Einbeziehung von Tiefeninformation neben dem herkömmlichen RGB-Bild als Eingabedaten, was als RGB-D SOD oder tiefenbewusste SOD bezeichnet wird. Gleichzeitig ist diese sich entwickelnde Forschungsrichtung erheblich durch Rauschen und Ambiguität beeinträchtigt, die in Roh-Tiefenbildern vorherrschen. Um diese Probleme anzugehen, schlagen wir einen Depth Calibration and Fusion (DCF)-Framework vor, der zwei neuartige Komponenten enthält: 1) eine Lernstrategie zur Kalibrierung des latente Bias in den ursprünglichen Tiefenkarten, um die SOD-Leistung zu steigern; 2) ein einfaches, jedoch wirksames Cross-Reference-Modul zur Fusions von Merkmalen aus RGB- und Tiefenmodality. Umfangreiche empirische Experimente zeigen, dass der vorgeschlagene Ansatz gegenüber 27 state-of-the-art-Methoden überlegene Ergebnisse erzielt. Darüber hinaus kann die vorgeschlagene Tiefenkalibrierungsstrategie als Vorverarbeitungsschritt auch auf bestehende führende RGB-D-SOD-Modelle angewendet werden, wobei signifikante Leistungsverbesserungen erreicht werden.