2ヶ月前
空間グループ畳み込みを用いた効率的な意味的シーン補完ネットワーク
Jiahui Zhang; Hao Zhao; Anbang Yao; Yurong Chen; Li Zhang; Hongen Liao

要約
3次元密予測タスクの計算を加速するために、空間グループ畳み込み(Spatial Group Convolution: SGC)を導入します。SGCは、特徴チャネル次元ではなく、空間次元で動作するグループ畳み込みとは直交しています。入力ボクセルを異なるグループに分割し、これらの分離されたグループに対して3次元スパース畳み込みを行います。畳み込みを行う際に有効なボクセルのみが考慮されるため、精度に若干の損失があるものの、計算量を大幅に削減することができます。提案された操作は、単一の深度画像から完全な3次元体積と意味ラベルを予測することを目指すセマンティックシーン補完タスクで検証されています。SGCを用いて、マルチスケールアーキテクチャと粗い予測から細かい予測への戦略を活用した効率的な3次元スパース畳み込みネットワークも提示します。SUNCGデータセットでの評価では、最先端の性能と高速性が達成されました。コードは https://github.com/zjhthu/SGC-Release.git で公開されています。