非監督3D学習による形状解析のための多分解能インスタンス識別

無教師特徴学習は、多くの分野でデータのラベリングやネットワーク設計の作業量を削減する利点を示していますが、既存の無教師3D学習方法では、監督付き方法と同等の性能を持つ汎用的なネットワークを様々な形状解析タスクに対して提供することはまだ困難です。本論文では、異なる形状解析タスクに適応可能な汎用的かつ効率的な形状エンコーディングネットワークを学習するための無教師方法を提案します。当該手法の核心的なアイデアは、ラベル付けされていない3Dポイントクラウドから形状とポイントの特徴を共同でエンコードし、学習することです。この目的のために、HR-Netをオクツリーに基づく畳み込みニューラルネットワークに適応させ、融合された多解像度サブネットワークを使用して形状とポイントの特徴を共同でエンコードします。さらに、単純でありながら効率的な多解像度インスタンス識別(MID)損失関数を設計し、形状とポイントの特徴を共同で学習します。当社のネットワークは3Dポイントクラウドを受け取り、形状とポイントの特徴を出力します。訓練後、このネットワークは単純なタスク固有のバックエンド層と結合され、微調整が行われて異なる形状解析タスクに対応します。我々は当該手法の有効性と汎用性を評価し、一連の形状解析タスク(形状分類、意味的な形状セグメンテーション、および形状登録タスクなど)を通じてネットワークと損失関数設計の妥当性を検証しました。単純なバックエンドを使用することで、当社のネットワークはすべての無教師方法の中で最良の性能を示し、特に小さなラベリング済みデータセットを持つタスクにおいて監督付き方法と競合する性能を達成しています。細かい形状セグメンテーションに関しては、当社的方法は既存の監督付き方法よりも大幅に優れた結果を得ています。