6ヶ月前

拡散モデル

ロボティクス

エムボディドインテリジェンス

アプローチ／フレームワーク

Dian Wang Stephen Hart David Surovik Tarik Kelestemur Haojie Huang Haibo Zhao Mark Yeatman Jiuguang Wang Robin Walters Robert Platt

概要

最近の研究では、行動クラッシング（behavior cloning）における示範データから生じる多モーダルな分布を学習する手法として、拡散モデル（diffusion models）が有効であることが示されている。しかしながら、このアプローチには、明示的な方策（policy）を学習するよりもはるかに複雑なノイズ除去関数（denoising function）を学習する必要があるという課題がある。本研究では、ドメインの対称性を活用することで、ノイズ除去関数のサンプル効率および一般化性能を向上させる、新たな拡散方策学習手法である「等変拡散方策（Equivariant Diffusion Policy）」を提案する。我々は、6自由度（6-DoF）制御における $\mathrm{SO}(2)$ 対称性について理論的に分析し、拡散モデルが $\mathrm{SO}(2)$ -等変（ $\mathrm{SO}(2)$ -equivariant）となる条件を同定した。さらに、MimicGenにおける12種類のシミュレーションタスクを用いた実証評価において、従来手法であるDiffusion Policyと比較して、平均で21.9%高い成功率を達成することを示した。また、実世界のシステム上でも本手法を評価した結果、少量の訓練サンプルで有効な方策が学習可能であることが明らかとなり、一方で従来のDiffusion Policyはそのような性能を達成できなかった。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

拡散モデル

ロボティクス

エムボディドインテリジェンス

アプローチ／フレームワーク

Dian Wang Stephen Hart David Surovik Tarik Kelestemur Haojie Huang Haibo Zhao Mark Yeatman Jiuguang Wang Robin Walters Robert Platt

概要

最近の研究では、行動クラッシング（behavior cloning）における示範データから生じる多モーダルな分布を学習する手法として、拡散モデル（diffusion models）が有効であることが示されている。しかしながら、このアプローチには、明示的な方策（policy）を学習するよりもはるかに複雑なノイズ除去関数（denoising function）を学習する必要があるという課題がある。本研究では、ドメインの対称性を活用することで、ノイズ除去関数のサンプル効率および一般化性能を向上させる、新たな拡散方策学習手法である「等変拡散方策（Equivariant Diffusion Policy）」を提案する。我々は、6自由度（6-DoF）制御における $\mathrm{SO}(2)$ 対称性について理論的に分析し、拡散モデルが $\mathrm{SO}(2)$ -等変（ $\mathrm{SO}(2)$ -equivariant）となる条件を同定した。さらに、MimicGenにおける12種類のシミュレーションタスクを用いた実証評価において、従来手法であるDiffusion Policyと比較して、平均で21.9%高い成功率を達成することを示した。また、実世界のシステム上でも本手法を評価した結果、少量の訓練サンプルで有効な方策が学習可能であることが明らかとなり、一方で従来のDiffusion Policyはそのような性能を達成できなかった。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

等変性拡散方策 | 記事 | HyperAI超神経