2ヶ月前
EdgeNet: 単一のRGB-D画像からの意味的シーン補完
Aloisio Dourado; Teofilo Emidio de Campos; Hansung Kim; Adrian Hilton

要約
セマンティックシーンコンプリーションは、単一の視点から得られるシーンに対して、対応するセマンティックラベル付きの完全な3次元ボリューム占有表現を予測するタスクです。これまでのRGB-Dデータからのセマンティックシーンコンプリーションに関する研究では、深度情報のみを使用するか、または2次元画像を3次元ボリュームに投影して得られる深度と色情報の組み合わせを使用していましたが、これにより疎なデータ表現が生成されていました。本研究では、エッジ検出と反転された符号付距離関数(flipped truncated signed distance)を使用して3次元空間に色情報をエンコードする新しい戦略を提案します。また、深度情報とエッジ情報の融合から生成される特徴量を処理できる新しいエンドツーエンドのニューラルネットワークアーキテクチャであるEdgeNetも提案します。実験結果は、実際のデータに対する最新手法との比較で6.9%の改善が見られることを示しています。