
要約
深層学習は形状分類、物体検出、意味分割を含む多くの3次元視覚認識タスクで著しい成功を収めています。しかし、これらの成果の多くは手動で収集された高密度にアノテーションされた実世界の3次元データに依存しており、その取得には非常に時間がかかり、費用もかかるため、3次元認識タスクの拡張性が制限されています。そこで、我々は教師なし3次元認識を研究し、自己監督-自己ラベリング3次元認識(Self-supervised-Self-Labeled 3D Recognition: SL3D)フレームワークを提案します。SL3Dはクラスタリングと特徴表現の学習という2つの関連する目的を同時に解決し、教師なし3次元認識のために疑似ラベル付きデータを生成します。SL3Dは汎用的なフレームワークであり、分類、物体検出、意味分割など異なる3次元認識タスクの解決に適用できます。広範な実験によりその有効性が示されています。コードはhttps://github.com/fcendra/sl3d で入手可能です。