Command Palette
Search for a command to run...
ワールドアクションモデルWAM
ワールドアクションモデル(WAM)は、身体化された知能とロボット工学の分野における、斬新なAI基盤モデルアーキテクチャです。これは2026年2月にNVIDIAによって初めて提案され、関連する研究は「...」というタイトルの論文で発表されました。世界行動モデルはゼロショット政策であるこの論文では、DreamZero(14パラメータのロボット基盤モデル)を提案し、この新しいアーキテクチャを定義するために、初めてワールドアクションモデル(WAM)という用語を明示的に使用しています。この論文では、従来のVLA(単一ステップのアクションのみをマッピングする)とは異なり、WAMは「将来の世界状態(ビデオストリーム)」と「ロボットのアクション」を共同で予測することで、物理世界の事前知識を直接継承する基盤モデルであり、非常に強力なゼロショット汎化能力(ゼロショットポリシー)を実現していると指摘しています。さらに、NVIDIAは「...」というタイトルのエントリを公式に公開しました。世界行動モデルとは何か?さらなる説明が必要です。
2026年5月、復旦大学、上海イノベーションアカデミー、シンガポール国立大学は、「ワールドアクションモデル:身体化されたAIの次なるフロンティア本論文は体系的なレビューを提供し、WAMを「予測状態モデリングと行動生成を統合する具現化された基礎モデルであり、行動そのものだけでなく、将来の状態と行動の共同分布を訓練することを目的としている」と明確に定義している。
NVIDIAと共に ドリームゼロ 例えば、WAMの基盤となるアーキテクチャは、実際には大規模ビデオ生成モデル(WAN2.1やNVIDIA Cosmosなどのビデオ配信バックボーンネットワークに基づく)です。コアとなるワークフローは、次の3つのステップに分けられます。
入力:現在の画面 + 音声コマンド + ロボットの現在の状態
⬇️
[WAMコアモデル(14BパラメータDiTアーキテクチャなど)]
⬇️
前方へのパス1回:
- 予測される未来の動画フレーム(世界が次にどう見えるか)
- 各フレームにおけるロボットの正確な動き(6自由度関節軌道)
この共同予測を通じて、行動と物理世界の進化は密接に結びついています。ロボットが正しく行動するためには、物理法則(重力、摩擦、遮蔽関係)に適合する未来の映像を頭の中で正しく生成する必要があります。