HyperAIHyperAI

Command Palette

Search for a command to run...

多様性だけで大規模なロボット操作は可能か?

Modi Shi Li Chen Jin Chen Yuxiang Lu Chiming Liu Guanghui Ren Ping Luo Di Huang Maoqing Yao Hongyang Li

概要

データスケーリングは、自然言語処理(NLP)やコンピュータビジョン(CV)の基盤モデルにおいて著しい成功をもたらしましたが、ロボット操作における効果的なデータスケーリングの原理はまだ十分に理解されていません。本研究では、タスク(何をするか)、エンバディメント(どのロボットを使うか)、エキスパート(誰がデモンストレーションを行うか)という3つの重要な次元に焦点を当て、ロボット学習におけるデータ多様性の微妙な役割を検討します。「より多様な方が良い」という従来の直感に挑戦しています。様々なロボットプラットフォームを用いた広範な実験を通じて、以下の3つの点を明らかにしました。(1) タスク多様性は、タスクごとのデモンストレーション数よりも重要であり、多様な事前学習タスクから新しい下流シナリオへの転移に寄与します;(2) 複数エンバディメントの事前学習データはクロスエンバディメント転移には必須ではなく、高品質な単一エンバディメントデータで学習したモデルは異なるプラットフォームへ効率的に転移でき、ファインチューニング時に複数エンバディメントで事前学習したモデルよりも望ましいスケーリング特性を示します;(3) 個々の操作偏好や人間によるデモンストレーションの確率的な変動から生じるエキスパート多様性はポリシー学習にとって混乱要因となり得ます。速度の多重モダリティが主要な貢献因子として現れました。これらの洞察に基づき、速度の曖昧さを緩和するための分布偏向補正方法を提案し、GO-1-Proは15%もの性能向上を達成しました。これは2.5倍の事前学習データを使用するのに相当します。総合的に見れば、これらの知見は新たな視点を提供し、ロボット操作データセットを効果的にスケールさせる方法について実践的な指針を与えています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています