DeepMind、実世界のロボット学習に向けた「夢の中の学習」AI「Dreamer 4」を発表
グーグルのDeepMindが、複雑なタスクを「想像の世界モデル」内で学習するAIエージェント「Dreamer 4」を発表した。このAIは、実際にゲームをプレイせず、人間が記録したプレイ動画のデータのみを用いて、マインクラフトでダイヤモンドを獲得するという長時間かつ複雑なタスクを達成した。これは、AIが実環境での試行錯誤を一切行わずに、内部のシミュレーション空間で学習できる初めての事例であり、ロボット工学への応用に大きな可能性を示している。 Dreamer 4は、Transformerベースのモデルで構成され、人間のプレイ動画から「世界の動態」を学習する。具体的には、マウスやキーボードの操作がもたらす物理的影響、たとえばブロックの破壊、道具の使用、工作台でのアイテム作成などを正確に再現する。この世界モデルは、実行中のリアルタイム処理が可能で、単一のGPUで動作し、人間が「夢の世界」を探索・検証することも可能だ。 従来のAIは、数百万回の試行錯誤を必要としていたが、Dreamer 4はわずか数百時間の動画データで、広範な状況に一般化する能力を獲得した。特に、行動データが少ない状況でも、動画から物理的な因果関係を学び取れる点が特徴。これは、実世界のロボットにとって、実機でのデータ収集が困難な点を補う上で極めて重要だ。 研究責任者であるDanijar Hafner氏は、「人間は世界の内部モデルを持ち、未来を予測して行動する。Dreamer 4は、そのような能力を模倣した」と説明。今後の課題として、長期記憶の導入や言語理解の統合を計画しており、人間と協働するAIの実現に向けた道筋を示している。 この成果は、AIが物理世界で安全かつ効率的に学習するための新しいアプローチを提示し、将来的な家庭用ロボットや工場自動化の実現に寄与する可能性を秘めている。