2ヶ月前
3Dデータでの物体分類に向けた体積CNNと多視点CNN
Charles R. Qi; Hao Su; Matthias Niessner; Angela Dai; Mengyuan Yan; Leonidas J. Guibas

要約
3D形状モデルは、その利用が広まり、取得も容易になっており、物体分類の進歩において3D情報の利用が重要な役割を果たしています。現行の最先端手法では、この問題に対処するためにCNN(畳み込みニューラルネットワーク)が用いられています。最近では、ボリューム表現に基づくCNNとマルチビュー表現に基づくCNNという2種類のCNNが開発されています。これらの2種類のCNNから得られた経験的な結果には大きな差があり、既存のボリュームCNNアーキテクチャや手法が3D表現の潜在能力を十分に活用できていないことを示唆しています。本論文では、既存手法の詳細な分析に基づいて、ボリュームCNNとマルチビューCNN双方を改善することを目指します。そのため、2つの異なるボリュームCNNのネットワークアーキテクチャを導入します。さらに、マルチビューCNNについても検討し、3Dにおける多解像度フィルタリングを導入します。全体として、我々はボリュームCNNとマルチビューCNN双方で現行の最先端手法を上回ることができました。また、基礎となる設計選択肢を評価するための広範な実験を行い、3Dデータ上の物体分類に利用可能な手法空間に対するより深い理解を提供しています。