2ヶ月前

中心からの投票:RGB-D画像における6自由度ポーズ推定のための径方向キーポイント投票

Wu, Yangzheng ; Zand, Mohsen ; Etemad, Ali ; Greenspan, Michael
中心からの投票:RGB-D画像における6自由度ポーズ推定のための径方向キーポイント投票
要約

私たちは、交差する球体に基づく新しいキーポイント投票スキームを提案します。このスキームは既存のスキームよりも精度が高く、より少ない数の分散したキーポイントを使用できます。スキームは点間の距離に基づいており、これは1次元の量であるため、従来の研究で回帰された2次元や3次元のベクトルとオフセット量よりも正確に推定でき、結果的により正確なキーポイント位置特定が可能となります。提案されたRCVPoseメソッドは、RGB-Dデータにおける3次元物体の6自由度姿勢推定に特に効果的であり、遮蔽物の処理にも優れています。CNN(畳み込みニューラルネットワーク)は、各RGBピクセルに対応する深度モードの3次元点と、物体座標系で定義された3つの分散したキーポイントとの距離を推定するために訓練されます。推論時には、この推定距離を半径とする各3次元点を中心とした球体が生成されます。これらの球体の表面が3次元累積空間を投票し、そのピークがキーポイント位置を示します。提案された放射状投票スキームは、以前のベクトルやオフセットスキームよりも精度が高く、分散したキーポイントに対して堅牢です。実験では、RCVPoseが非常に高い精度と競争力を示しており、LINEMODデータセットでは99.7%、YCB-Videoデータセットでは97.2%という最先端の結果を達成しています。特に困難なOcclusion LINEMODデータセットにおいては、以前の手法よりも+4.9%高い71.1%というスコアを記録しており、BOPベンチマークから発表されたこれらの3つのデータセットに関するすべての他の結果を平均して上回っています。私たちのコードはhttp://www.github.com/aaronwool/rcvposeで入手可能です。

中心からの投票:RGB-D画像における6自由度ポーズ推定のための径方向キーポイント投票 | 最新論文 | HyperAI超神経