
要約
本論文では、3次元形状を単一の画像から高解像度で再構成できる新しい効率的な2次元符号化手法を開発しています。この手法の核心は、3次元形状の再構成を2次元予測問題として扱うことです。そのため、まず基準となるネットワークを構築し、参照ビューの各ピクセルに対して全体のボクセルチューブを予測します。2次元ピクセル予測タスクに適した既存のアーキテクチャを利用することで、最先端の結果を得ることができ、純粋なボクセルベースのアプローチを明確に上回っています。さらに、この基準モデルをより高い解像度にスケールアップするために、メモリ効率の良い形状符号化手法を提案します。この手法は、3次元形状をマトリョーシカ人形のようにネストされた形状層に再帰的に分解します。これにより、複雑なトポロジーを持つ非常に詳細な形状を再構成することが可能であり、広範な実験でその有効性が示されています。当該アーキテクチャは標準的なネットワークコンポーネントを使用しているにもかかわらず、従来のオクトリーベースのアプローチよりも優れた性能を達成しています。また、当社のマトリョーシカネットワークは、IDや形状類似性に基づいて形状を再構成するだけでなく、形状サンプリングも可能にします。