HyperAIHyperAI

Command Palette

Search for a command to run...

AtlasにAI新搭載、人間の動作を学習して複雑な作業を自律実行

波士顿动力と丰田研究所(TRI)は、人形ロボット「Atlas」に大型行動モデル(Large Behavior Models, LBMs)を搭載する技術革新を発表した。この進展により、Atlasは従来の複雑な事前プログラミングに頼らず、人間の動作を観察するだけで新スキルを学習可能となり、多様なタスクを処理する通用型ロボットへの道筋を大きく前進させた。 従来のロボット開発は、すべての状況に応じた手動コードの作成が必須で、環境のわずかな変化でも動作が崩れやすかった。TRIの大型行動モデル上級副社長、ラス・テドレーク氏は、「人形ロボットの価値は、人間が住む環境で多様な作業をこなせることにあるが、従来の方法ではその拡張が不可能だった」と指摘。新システムは、人間の動作をリアルタイムで記録する仮想現実(VR)遠隔操作システムを活用。操作者がVRでAtlasの視点から操作しながら、カメラ画像、体の姿勢データ、言語指示などを統合して収集。この多モーダルデータを、4.5億パラメータの拡散変換器(Diffusion Transformer)ベースの神経ネットワークで学習させ、言語命令から一連の物理的動作へと変換する「エンドツーエンド」のAI戦略を実現。 その成果として、Atlasは推車から四足ロボットSpotの部品を取り出し、折りたたんで棚に置き、その後、引き出しを開けて部品を収納、さらに雑多な部品を別の推車へ移動するなど、複数の動作を連続して行う長時間・高複雑度のタスクを自律的に遂行。さらに、実験中に箱の蓋が閉じられたり部品が落ちたりする意図的な干渉にも、自動で対処。蓋を開け直したり、地面の部品を拾い上げたりする「自己修正」能力を発揮した。これは、事前コードではなく、学習データに含まれる多様な状況と回復行動を統合したモデルによるもので、動的な環境への適応力の飛躍を示している。 また、研究チームは、異なるタスクやロボットプラットフォーム(Atlas本体、上半身テスト台、TRIのデータなど)を統合して一つの「汎用戦略モデル」を学習。これにより、特定タスクに特化したモデルではなく、さまざまな物体(工具、布、タイヤなど)に対応する柔軟性が生まれ、開発の再利用性と効率が向上した。さらに、学習済みモデルは、実行速度を人間の1.5~2倍まで向上させ、再学習なしに高効率な動作を実現。 この進展は、物理的ハードウェアと高精度シミュレーションを活用した高速反復開発体制の成果でもある。今後は、大量データの収集コストなど課題が残るが、波士顿動力とTRIの共同研究は、人形ロボットの実用化に向けた重要な一歩を示している。

関連リンク

AtlasにAI新搭載、人間の動作を学習して複雑な作業を自律実行 | 人気の記事 | HyperAI超神経