Command Palette
Search for a command to run...
FoldingNet:ディープグリッド変形を用いた点群オートエンコーダー
FoldingNet:ディープグリッド変形を用いた点群オートエンコーダー
Yang Yaoqing Feng Chen Shen Yiru Tian Dong
概要
点群における教師あり学習タスク、例えば分類やセグメンテーションにおいて、PointNet などの点集合内の点を直接処理する最近の深層ネットワークが最先端の性能を示している。本研究では、点群における教師なし学習の課題に対応するため、新たなエンドツーエンド型の深層オートエンコーダーを提案する。エンコーダー側では、PointNetの枠組み上に局所構造の強化を実現するグラフベースの拡張を導入する。その後、新たな折り畳み(folding)に基づくデコーダーを用いて、標準的な2次元グリッドを点群の背後にある3次元オブジェクト表面に変形させることで、細部構造を持つオブジェクトに対しても低い再構成誤差を達成する。提案するデコーダーは、全結合ニューラルネットワークを用いたデコーダーと比較して約7%のパラメータ数で済みながら、より判別力の高い表現を生成し、ベンチマークを上回る線形SVM分類精度を達成している。さらに、理論的にも本提案デコーダー構造が、任意の点群を2次元グリッドから再構成可能な汎用的なアーキテクチャであることが示されている。本研究のコードは、http://www.merl.com/research/license#FoldingNet にて公開されている。