11日前

RGB-D顕著オブジェクト検出のためのカスケードグラフニューラルネットワーク

Ao Luo, Xin Li, Fan Yang, Zhicheng Jiao, Hong Cheng, Siwei Lyu
RGB-D顕著オブジェクト検出のためのカスケードグラフニューラルネットワーク
要約

本稿では、カラー画像と深度情報の両方を活用したRGB-D画像における顕著対象検出(SOD: Salient Object Detection)の問題に取り組む。RGB-D画像からの顕著対象検出において直面する主要な技術的課題は、互いに補完的な2つのデータソースをいかに効果的に活用するかにある。現在の手法は、主にRGB画像の処理に深さマップから得られる事前知識を単純に抽出するか、カラー情報と幾何情報の盲目的な融合によって粗い深さ認識特徴表現を生成するものである。これにより、RGB-D顕著性検出器の性能が制限されている。本研究では、2つのデータソース間の相互利益を段階的なグラフ構造を通じて包括的に抽出・推論できる統合型フレームワークである「カスケードグラフニューラルネットワーク(Cas-GNN)」を提案する。Cas-GNNは両データソースを別々に処理し、新たな「カスケードグラフ推論(CGR: Cascade Graph Reasoning)」モジュールを用いて、顕著性マップを容易に推定可能な強力な密な特徴埋め込みを学習する。従来のアプローチとは異なり、補完的データソース間の高次関係を明示的にモデリング・推論することで、隠蔽や曖昧性といった課題をより効果的に克服できる。広範な実験により、Cas-GNNが複数の広く用いられているベンチマークにおいて、既存のすべてのRGB-D SOD手法を大きく上回る性能を達成することが実証された。

RGB-D顕著オブジェクト検出のためのカスケードグラフニューラルネットワーク | 最新論文 | HyperAI超神経