2ヶ月前
3Dセマンティックセグメンテーションにおけるサブマニフォールドスパース畳み込みネットワークの利用
Benjamin Graham; Martin Engelcke; Laurens van der Maaten

要約
畳み込みネットワークは、画像、動画、3D形状などの時空間データを解析する際の事実上の標準となっています。これらのデータの一部は自然に密(例えば、写真)ですが、多くの他のデータ源は本質的に疎です。LiDARスキャナーやRGB-Dカメラで取得された3Dポイントクラウドなどがその例に該当します。標準的な「密」畳み込みネットワークの実装は、このような疎なデータに対して非常に非効率的です。そこで、空間的に疎なデータをより効率的に処理するために設計された新しい疎な畳み込み演算を導入し、それらを使用して空間的に疎な畳み込みネットワークを開発しました。私たちは、この結果得られたモデルであるサブマニフォールド疎畳み込みネットワーク(SSCNs: submanifold sparse convolutional networks)が、3Dポイントクラウドの意味分割に関連する2つのタスクにおいて優れた性能を示すことを示しています。特に、私たちのモデルは最近の意味分割コンペティションのテストセットにおいてこれまでの最先端技術を全て上回る性能を発揮しています。