2ヶ月前

深度認識CNNを用いたRGB-Dセグメンテーション

Weiyue Wang; Ulrich Neumann
深度認識CNNを用いたRGB-Dセグメンテーション
要約

畳み込みニューラルネットワーク(CNN)は、固定グリッドカーネル構造のため、幾何学的情報を処理する能力に制限があります。深さデータの利用により、RGB-DセマンティックセグメンテーションにおけるCNNの進歩が可能となりました。最先端の手法では、深さデータを追加の画像として使用するか、3次元ボリュームやポイントクラウドでの空間情報を処理することが一般的です。これらの手法は、高い計算量とメモリコストを伴うという問題があります。これらの課題に対処するために、我々は深度認識型CNNを提案します。この手法では、直感的で柔軟かつ効果的な2つの操作である深度認識型畳み込みと深度認識型平均プーリングを導入します。情報伝播過程においてピクセル間の深度類似性を利用することで、幾何学的情報がCNNにシームレスに組み込まれます。追加のパラメータを導入せずに、両方の演算子は既存のCNNに容易に統合できます。挑戦的なRGB-Dセマンティックセグメンテーションベンチマークに対する広範な実験とアブレーションスタディにより、当手法の有効性と柔軟性が検証されています。

深度認識CNNを用いたRGB-Dセグメンテーション | 最新論文 | HyperAI超神経