HyperAIHyperAI

Command Palette

Search for a command to run...

等変性拡散方策

Dian Wang Stephen Hart David Surovik Tarik Kelestemur Haojie Huang Haibo Zhao Mark Yeatman Jiuguang Wang Robin Walters Robert Platt

概要

最近の研究では、行動クラッシング(behavior cloning)における示範データから生じる多モーダルな分布を学習する手法として、拡散モデル(diffusion models)が有効であることが示されている。しかしながら、このアプローチには、明示的な方策(policy)を学習するよりもはるかに複雑なノイズ除去関数(denoising function)を学習する必要があるという課題がある。本研究では、ドメインの対称性を活用することで、ノイズ除去関数のサンプル効率および一般化性能を向上させる、新たな拡散方策学習手法である「等変拡散方策(Equivariant Diffusion Policy)」を提案する。我々は、6自由度(6-DoF)制御におけるSO(2)\mathrm{SO}(2)SO(2)対称性について理論的に分析し、拡散モデルがSO(2)\mathrm{SO}(2)SO(2)-等変(SO(2)\mathrm{SO}(2)SO(2)-equivariant)となる条件を同定した。さらに、MimicGenにおける12種類のシミュレーションタスクを用いた実証評価において、従来手法であるDiffusion Policyと比較して、平均で21.9%高い成功率を達成することを示した。また、実世界のシステム上でも本手法を評価した結果、少量の訓練サンプルで有効な方策が学習可能であることが明らかとなり、一方で従来のDiffusion Policyはそのような性能を達成できなかった。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
等変性拡散方策 | 記事 | HyperAI超神経