8ヶ月前

マルチタスク学習

エムボディドインテリジェンス

アプローチ／フレームワーク

マルチモーダル

Ankit Goyal Valts Blukis Jie Xu Yijie Guo Yu-Wei Chao Dieter Fox

概要

本研究では、言語指示に基づいて複数の3次元操作タスクを解決できるロボットシステムの構築方法について考察します。産業および家庭用領域で有用となるためには、このシステムが少数のデモンストレーションから新しいタスクを学習し、正確に解決することが必要です。PerActやRVTなどの先行研究はこの問題を取り上げていますが、高精度を要するタスクにおいてしばしば困難を抱えています。本研究では、これらのシステムをより効果的かつ精密に、さらに高速化する方法を探ります。アーキテクチャとシステムレベルでの改善点を組み合わせることで、前モデルRVTよりも訓練時に6倍速く、推論時に2倍速いマルチタスク3次元操作モデルRVT-2を提案します。RVT-2はRLBenchにおいて新たな最先端の成果を達成し、成功率を65%から82%に向上させました。また、現実世界でも効果的であり、プラグの取り外しや挿入など高精度が必要なタスクをわずか10回のデモンストレーションで学習することができます。視覚的な結果やコード、学習済みモデルは以下のウェブサイトで提供されています: https://robotic-view-transformer-2.github.io/。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

マルチタスク学習

エムボディドインテリジェンス

アプローチ／フレームワーク

マルチモーダル

Ankit Goyal Valts Blukis Jie Xu Yijie Guo Yu-Wei Chao Dieter Fox

概要

本研究では、言語指示に基づいて複数の3次元操作タスクを解決できるロボットシステムの構築方法について考察します。産業および家庭用領域で有用となるためには、このシステムが少数のデモンストレーションから新しいタスクを学習し、正確に解決することが必要です。PerActやRVTなどの先行研究はこの問題を取り上げていますが、高精度を要するタスクにおいてしばしば困難を抱えています。本研究では、これらのシステムをより効果的かつ精密に、さらに高速化する方法を探ります。アーキテクチャとシステムレベルでの改善点を組み合わせることで、前モデルRVTよりも訓練時に6倍速く、推論時に2倍速いマルチタスク3次元操作モデルRVT-2を提案します。RVT-2はRLBenchにおいて新たな最先端の成果を達成し、成功率を65%から82%に向上させました。また、現実世界でも効果的であり、プラグの取り外しや挿入など高精度が必要なタスクをわずか10回のデモンストレーションで学習することができます。視覚的な結果やコード、学習済みモデルは以下のウェブサイトで提供されています: https://robotic-view-transformer-2.github.io/。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています