
要約
位置に関する識別力に優れた深度データは、正確な注目度予測に有益であることが実証されている。しかし、RGB-D注目度検出手法は、深度マップ上にランダムに分布する誤差領域や欠損領域、あるいは物体境界付近の不正確な情報によっても悪影響を受ける。これにより、適切に設計されたモデルによってより効果的な推論が可能となる。本論文では、2つのモダリティ(RGBと深度)からの局所的および大域的な補完性を考慮した、高精度なRGB-D注目度検出のための新しいフレームワークを提案する。この目的を達成するために、RGBデータと深度データから有用な表現を同時に選択しつつ、物体境界の精緻化も行える十分な識別力を備えた補完的相互作用モデルを設計した。さらに、補完的相互作用モデルで考慮されていない情報をさらに処理するため、補償を意識した損失関数を提案し、困難なシーンにおける一般化能力の向上を図った。6つの公開データセットにおける実験結果から、本手法が18の最先端手法を上回ることを示した。