16日前
JL-DCF:RGB-D顕著オブジェクト検出を 위한共同学習および密結合融合フレームワーク
Keren Fu, Deng-Ping Fan, Ge-Peng Ji, Qijun Zhao

要約
本稿では、RGB-D顕著対象検出のための新規な共同学習および密な協調融合(JL-DCF)アーキテクチャを提案する。従来のモデルは、RGB画像と深度情報(depth)を独立した情報として扱い、それぞれに別々のネットワークを設計して特徴抽出を行うことが一般的である。しかし、このような手法は訓練データの量が限られている場合や、高度に設計された学習プロセスに過度に依存する場合、性能が制限されやすいという課題を抱えている。これに対して、本研究ではシアンス型ネットワーク(Siamese network)を用いて、RGBと深度の両入力から同時に学習を行うJL-DCFアーキテクチャを構築した。この目的のために、二つの効果的なモジュールを提案する:共同学習(Joint Learning, JL)と密な協調融合(Densely-Cooperative Fusion, DCF)。JLモジュールは、堅牢な顕著性特徴の学習を実現するのに対し、DCFモジュールは補完的な特徴の発見を目的として導入されている。4つの代表的な評価指標を用いた包括的な実験により、提案したフレームワークが優れた汎化性能を備えた堅牢なRGB-D顕著性検出器として機能することを示した。結果として、JL-DCFは6つの難易度の高いデータセット上で、トップ1のD3Netモデルを平均して約1.9%(S-measure)向上させ、実世界応用における有望な解決策を提供していることを示している。さらに、モダリティ間補完性の理解に新たな知見をもたらす可能性を示唆している。実装コードは、https://github.com/kerenfu/JLDCF/ にて公開される予定である。