
要約
最近、点群登録に学習を組み込む試みが進展しているが、多くの研究では特徴記述子の学習に注力し、最終的な対応点群の取得には依然として最近傍特徴マッチングとRANSACを用いた外れ値除去に依存している。本研究では、明示的な特徴マッチングおよびRANSACの役割をアテンション機構が代替可能であると仮定し、最終的な対応点群を直接予測するエンドツーエンドのフレームワークを提案する。本手法では、自己アテンションとクロスアテンションを含むTransformer層を主軸とするネットワークアーキテクチャを用い、各点が重複領域に含まれる確率および他点群における対応位置を予測するように学習させる。これにより、追加の後処理を経ることなく、予測された対応点群から直接剛体変換を推定可能となる。単純な構成でありながら、本手法は3DMatchおよびModelNetベンチマークにおいて最先端の性能を達成した。実装コードは以下のURLから入手可能である:https://github.com/yewzijian/RegTR。