1ヶ月前

ロボットの把持検出に深層学習を用いる

Ian Lenz; Honglak Lee; Ashutosh Saxena
ロボットの把持検出に深層学習を用いる
要約

物体を含むシーンのRGB-D画像におけるロボットの把持検出問題について考察します。本研究では、特徴量の手動設計を避けるため、深層学習手法を適用してこの問題を解決します。これには主に2つの課題があります。第一に、大量の候補把持点を評価する必要があります。検出を高速かつ堅牢にするために、2つの深層ネットワークからなる2段階のカスケード構造を提案します。最初のネットワークは特徴量が少なく、実行速度が速く、非現実的な候補把持点を効果的に除去できます。第二のネットワークは特徴量が多く、遅いですが、最初のネットワークで選ばれた上位の少数の候補のみに適用されます。第二に、多様な入力モーダルに対応する必要があります。これに対して、マルチモーダルグループ正則化に基づいた重みに対する構造化正則化手法を提案します。我々の手法が既存の最先端手法よりも優れており、異なる2つのロボットプラットフォーム上で成功裏に把持動作を行うことができることを示しています。注:「RGB-D」は「Red Green Blue - Depth」(色情報と深度情報)、「カスケード構造」は「cascaded structure」、「マルチモーダルグループ正則化」は「multimodal group regularization」などの専門用語を使用しています。これらの用語は一般的な日本語では使用されませんが、技術文献や論文ではよく見られる表現です。

ロボットの把持検出に深層学習を用いる | 最新論文 | HyperAI超神経