13日前
3次元ポイントクラウドのセマンティックセグメンテーションのための数値適応型プロトタイプ学習
Yangheng Zhao, Jun Wang, Xiaolong Li, Yue Hu, Ce Zhang, Yanfeng Wang, Siheng Chen

要約
3次元点群の意味的セグメンテーションは、3次元シーン理解における基本的なタスクの一つであり、メタバース応用において広く利用されている。近年の多くの3次元意味的セグメンテーション手法は、各意味クラスに対して1つのプロトタイプ(分類器の重み)を学習し、3次元点をそのクラスに最も近いプロトタイプに基づいて分類している。しかし、各クラスに対して1つのプロトタイプしか学習しない方式では、クラス内に存在する高次元なパターン変動を十分に表現する能力に制限がある。本稿では、各クラスに対して単一のプロトタイプを学習するのではなく、意味クラス内の異なる点パターンを動的に表現できるように、適応的な数のプロトタイプを用いる手法を提案する。視覚変換器(Vision Transformer)の強力な表現能力を活かし、点群の意味的セグメンテーションに適した「数適応型プロトタイプ学習(Number-Adaptive Prototype Learning: NAPL)」モデルを設計した。NAPLモデルの学習のために、単純ながら効果的なプロトタイプドロップアウト訓練戦略を提案し、モデルが各クラスに対して適応的にプロトタイプを生成できるようにした。SemanticKITTIデータセットにおける実験結果から、点単位分類パラダイムに基づくベースラインモデルと比較して、本手法はmIoUで2.3%の向上を達成したことが示された。