11日前

3D Diffusion Policy：シンプルな3D表現を用いた汎用的な視覚運動方策学習

Yanjie Ze, Gu Zhang, Kangning Zhang, Chenyuan Hu, Muhan Wang, Huazhe Xu

要約

模倣学習は、ロボットに機敏なスキルを効率的に教えるための有効な手法である。しかし、複雑なスキルを堅牢かつ汎化可能な形で学習するには、通常、膨大な数の人間のデモンストレーションが必要となる。この課題に取り組むために、我々は3Dディフュージョンポリシー（DP3）を提案する。DP3は、条件付き行動生成モデルの一種であるディフュージョンポリシーに、3D視覚表現の力を統合した、新たな視覚的模倣学習アプローチである。DP3の核心的な設計は、効率的なポイントエンコーダを用いてスパースな点群から抽出されたコンパクトな3D視覚表現を活用することにある。72のシミュレーションタスクを対象とした実験では、DP3はわずか10回のデモンストレーションで大多数のタスクを成功裏に処理し、ベースライン手法に対して24.2%の相対的な性能向上を達成した。また、4つの実ロボットタスクにおいても、各タスクに対してたった40回のデモンストレーションで、85%の高い成功率を達成し、空間的配置、視点、外観、インスタンスといった多様な条件下で優れた汎化能力を示した。興味深いことに、実ロボット実験においてDP3は安全要件をほとんど違反せず、一方でベースライン手法は頻繁に違反し、人間の介入を要する場合が多かった。広範な評価を通じて、本研究は現実世界におけるロボット学習において3D表現の重要性が極めて大きいことを強調している。動画、コード、データは、https://3d-diffusion-policy.github.io にて公開されている。