李飛飛氏:世界モデルの分類体系を提言
李飛飛氏が提唱する世界モデルの分類法と産業影響 2025年以降、SoraやNVIDIA OmniverseなどAI・ロボット・ゲーム領域で「世界モデル」の呼称が乱立し、技術文脈が混乱している。この状況を整理するため、斯坦福大学の李飛飛氏は近日、個人サブスタックにて強化学習のPOMDP閉ループに基づく分類法を発表した。同氏は、現在世界モデルと称される技術を実質的に同じ閉ループの異なる出力へと投影し、レンダラー、シミュレータ、プランナーの三つに大別する。 レンダラーは観測ピクセルを出力し商業化が最先端だが、物理的法則を反映しないため設計や制御への応用に上限がある。プランナーは動作計画を出力しロボット応用に期待大だが、実環境での複雑さや耐久性を検証できておらず実用化には遠い。シミュレータは幾何・物理・力学の状態を出力し、レンダラーとプランナーの双方の基盤となる中枢として機能する。物理シミュレーション基盤を掌握すれば、視覚表現と動作予測の両方を派生可能であり、その市場潜在性は極めて大きい。 企業動向としては、World Labsが自社モデルMarbleにてガウシアンスプレーティングと衝突メッシュを同時生成し、レンダラーとシミュレータの境界を融合させようとしている。業界全体では、単一アーキテクチャ内で視覚生成・物理予測・動作計画を統合する統一型世界基礎モデルへの移行が進む。データ偏在やsim-to-realギャップといった技術課題は残るものの、三領域の境界消失は空間知能の次世代基盤を定義する。李氏の分類法は現在の用語混乱を整理し、研究開発と企業戦略の方向性を示す有効な分析枠組みとして定着しつつある。
