HyperAI超神経
Back to Headlines

トヨタ研究所、ロボット学習に革命をもたらす「大行為モデル」発表:80%のデータ削減で数百のタスクを1モデルで実行

5日前

トヨタ研究機構(TRI)は、ロボットの学習方法に大きな変化をもたらす「大規模行動モデル(Large Behavior Models、LBM)」に関する画期的な研究成果を発表した。この技術により、ロボットは新規タスクを学ぶ際のデータ量を最大80%削減し、一つのモデルで数百の操作スキルを習得可能となる。論文は『大規模行動モデルによる多タスク精密操作の詳細検証』(A Careful Examination of Large Behavior Models for Multitask Dexterous Manipulation)として、arXivに掲載された。 TRIの副社長でマサチューセッツ工科大学(MIT)教授のRuss Tedrake氏は、LBMが有効であることを強調し、「予備学習データが増えれば、性能も一貫して向上する」と述べた。LBMは、大規模言語モデル(LLM)の構造を参考にしつつ、ロボットの物理的操作に特化した設計を採用。視覚情報、ロボットの姿勢や位置、自然言語による指示を統合し、動作指令を直接出力する。1.6秒先の16ステップの動作を一括して予測する能力を持つ。 研究では、約1,700時間のロボット操作データを用いてLBMを訓練し、1,800回の実機テストと47,000回のシミュレーションで評価。結果として、微調整後のLBMは単一タスクモデルよりも優れた性能を示し、データ量が少ない場合でも効果的な学習が可能であることが判明。 また、研究チームは、統計的な厳密性を重視し、信頼区間の幅を示す「CLD(Compact Letter Display)」という新しい評価手法を導入。この方法により、ロボット学習の効果をより正確に測定できるようになった。 ただし、LBMには課題も存在。非微調整モデルは性能が不均一で、言語誘導の限界が影響している可能性がある。今後の研究では、モデルの改善とデータの統一性の向上が課題となる。 この研究は、AIを活用したロボット開発の新たな方向性を示し、トヨタが今後もロボット技術に注力する姿勢を反映している。

Related Links