2ヶ月前

FPNN: 3Dデータ用のフィールドプロービングニューラルネットワーク

Yangyan Li; Soeren Pirk; Hao Su; Charles R. Qi; Leonidas J. Guibas
FPNN: 3Dデータ用のフィールドプロービングニューラルネットワーク
要約

3次元データの識別的表現を構築することは、コンピュータグラフィックスおよびコンピュータビジョン研究において重要な課題となっています。畳み込みニューラルネットワーク(CNNs)は、様々なタスクに対して2次元画像上で大きな成功を収めています。3次元への畳み込み演算子の拡張(3DCNNs)は、合理的で有望な次のステップのように思われます。しかし、3DCNNsの計算複雑さはボクセル解像度に立方的に増加します。さらに、ほとんどの3次元形状表現が境界ベースであるため、占有領域は離散化のサイズに比例して増加せず、計算リソースが浪費される結果となります。本研究では、3次元空間を体積場として表現し、効率的に特徴量を抽出するための新しい設計であるフィールドプロービングフィルターを提案します。各フィールドプロービングフィルターは一連のプロービングポイント(空間を感知するセンサー)から構成されます。我々の学習アルゴリズムは、プロービングポイントに関連付けられた重みだけでなく、その位置も最適化することで、プロービングフィルターの形状を変形させ、3次元空間内で適応的に分布させることが可能です。最適化されたプロービングポイントは、「知能的に」3次元空間を感知し、全領域に対して盲目的に操作することなく機能します。我々は、3Dオブジェクト認識ベンチマークデータセットでの分類タスクにおいて、フィールドプロービングが3DCNNsよりも著しく効率的でありながら最先端の性能を提供することを示しています。

FPNN: 3Dデータ用のフィールドプロービングニューラルネットワーク | 最新論文 | HyperAI超神経