2ヶ月前

RGB画像からの6D物体検出のための暗黙的な3D方向学習

Martin Sundermeyer; Zoltan-Csaba Marton; Maximilian Durner; Manuel Brucker; Rudolph Triebel
RGB画像からの6D物体検出のための暗黙的な3D方向学習
要約

我々は物体検出と6次元姿勢推定のためのリアルタイムRGBベースのパイプラインを提案します。我々の新しい3次元方向推定手法は、ドメインランダマイゼーションを使用して3Dモデルのシミュレーションビューで訓練されたデノイジングオートエンコーダーの変種に基づいています。この所谓的「拡張オートエンコーダー」は既存の手法に比べていくつかの利点があります:実際の姿勢アノテーション付きトレーニングデータを必要とせず、様々なテストセンサーに対して汎化が可能であり、物体や視点の対称性を本質的に処理できます。入力画像から物体姿勢への明示的なマッピングを学習する代わりに、潜在空間内のサンプルによって定義される物体方向の暗黙的な表現を提供します。我々のパイプラインはT-LESSデータセットにおいてRGBおよびRGB-D領域双方で最先端の性能を達成しています。また、LineMODデータセットでも他の合成データで訓練された手法と競合できる性能を示しています。さらに、物体が画像中心から外れた場合に生じる透視誤差を補正することで3次元方向推定精度を向上させ、拡張結果も示しています。注:- 「Augmented Autoencoder」は「拡張オートエンコーダー」と訳しました。- 「Domain Randomization」は「ドメインランダマイゼーション」と訳しました。- 「pose-annotated training data」は「姿勢アノテーション付きトレーニングデータ」と訳しました。- 「latent space」は「潜在空間」と訳しました。- 「state-of-the-art performance」は「最先端の性能」と訳しました。- 「perspective errors」は「透視誤差」と訳しました。

RGB画像からの6D物体検出のための暗黙的な3D方向学習 | 最新論文 | HyperAI超神経