2ヶ月前

グラフネットワークを学習可能な物理エンジンとして推論と制御に利用する

Alvaro Sanchez-Gonzalez; Nicolas Heess; Jost Tobias Springenberg; Josh Merel; Martin Riedmiller; Raia Hadsell; Peter Battaglia
グラフネットワークを学習可能な物理エンジンとして推論と制御に利用する
要約

日常の物理的なシーンを理解し、それと相互作用するためには、世界の構造に関する豊富な知識が必要であり、これは価値関数や方策関数に暗黙的に表現されるか、遷移モデルに明示的に表現されます。本稿では、グラフネットワークに基づく新しい学習可能なモデルクラスを紹介します。このモデルは、複雑で動的なシステムのオブジェクト中心および関係中心の表現に対する帰納的バイアスを実装しています。我々の結果は、前向きモデルとして、我々の手法が実際のデータやシミュレーションデータから正確な予測をサポートし、8つの異なる物理システム(パラメトリックおよび構造的に変化させたもの)において驚くほど強力かつ効率的な一般化能力を持つことを示しています。また、推論モデルがシステム同定を行うことができることも確認しました。我々のモデルは微分可能であり、勾配ベースの軌道最適化によるオンライン計画やオフラインの方策最適化をサポートします。我々のフレームワークは世界に関する豊富な知識を活用・利用する新たな機会を提供し、より人間らしい世界の表現を持つ機械の開発に向けて重要な一歩を踏み出しています。

グラフネットワークを学習可能な物理エンジンとして推論と制御に利用する | 最新論文 | HyperAI超神経