
要約
既存の点群解析用トランスフォーマー基盤モデルは、二次複雑さを有しており、これにより点群解像度が低下し、情報損失が生じる問題があります。これに対して、新しく提案されたMambaモデル(状態空間モデル(SSM)に基づく)は線形複雑さでトランスフォーマーを多个の面で上回ります。しかし、Mambaを点群タスクにそのまま適用すると満足できる性能を得ることができません。本研究では、点群学習に特化した状態空間モデルであるMamba3Dを提示します。これは局所的な特徴抽出を強化し、優れた性能、高い効率性、およびスケーラビリティの可能性を実現します。具体的には、単純ながら効果的な局所ノルムプーリング(LNP)ブロックを提案して局所幾何学的特徴を抽出します。さらに、より良い全体的な特徴を得るために、トークン前向きSSMと新しい後ろ向きSSM(特徴チャネル上で動作する)からなる双方向SSM(bi-SSM)を導入します。広範な実験結果は、事前学習の有無に関わらず、Mamba3Dがトランスフォーマー基盤の対応モデルや同時期の研究よりも多个のタスクで優れていることを示しています。特に注目に値するのは、ScanObjectNNでの全体精度92.6%(ゼロから学習)、ModelNet40分類タスクでの95.1%(単一モーダル事前学習あり)という数値です。これらはすべて線形複雑さのもとで達成されています。当方のコードと重みは以下のURLから入手可能です: https://github.com/xhanxu/Mamba3D.