
要約
本稿では、シーンのnチャンネル画像から未知の物体に対する反対向把持(antipodal grasp)の生成と実行という課題に取り組むためのモジュール型ロボットシステムを提案する。我々は、リアルタイム速度(約20ms)でnチャンネル入力から堅牢な反対向把持を生成可能な新しい生成型残差畳み込みニューラルネットワーク(Generative Residual Convolutional Neural Network, GR-ConvNet)モデルを提案する。このモデルのアーキテクチャは、標準データセットおよび多様な家庭用物品を用いて評価された結果、Cornell把持データセットおよびJacquard把持データセットにおいて、それぞれ97.7%および94.6%という最先端の精度を達成した。さらに、7自由度のロボットアームを用いて、家庭用物品および悪意ある(adversarial)物体に対して、それぞれ95.4%および93%の把持成功率を実証した。