Googleの新プロジェクトGenieが登場、写真やプロンプトからインタラクティブな無限の世界を生成可能に
2024年8月、Google DeepMindは汎用的世界モデル「Genie 3」の概要を発表し、動的なインタラクティブな世界をリアルタイムで生成する可能性を示した。このモデルは、従来の静的3Dシーンとは異なり、ユーザーの行動に応じて環境の進化を予測・生成する点が特徴。物理法則や相互作用をシミュレートし、ロボット工学、アニメーション制作、歴史再現、フィクション世界の構築など、多様な分野での応用が期待されている。この技術は、特定のゲームやタスクに特化したAIエージェント(例:チェスや囲碁)とは異なり、現実世界の複雑さを扱う人工一般知能(AGI)の実現に向けた重要な一歩と位置づけられている。 その進化の次段階として、Googleは「Project Genie」として実験的な研究プロトタイプを発表。これは、Genie 3を基盤にしたウェブアプリで、Google AI Ultra(米国・18歳以上)のサブスクライバーに限定的に提供を開始した。ユーザーは60秒ごとに新しい世界を生成し、探索・編集・再利用(リミックス)できる。このプロトタイプは、Genie 3、Nano Banana Pro、Geminiの技術を統合し、リアルタイムで環境の先を生成する能力を体感できる仕組みとなっている。 Project Genieの中心的な機能は、3つの柱から成る。第一に「生成」:ユーザーがテキストやプロンプトで世界の設定を入力し、60秒単位で動的な環境を生成。第二に「探索」:生成された世界内で自由に移動・操作し、物理的反応やイベントの進行を体験。第三に「リミックス」:既存の世界をカスタマイズし、新たなシナリオやルールを加えることで、独自の体験を創出可能。この仕組みにより、ユーザーは単なる観察者ではなく、世界の創造者として参加できる。 ただし、これは実験的プロトタイプであり、初期段階のモデルであるため、一部の機能が未実装。例えば、探索中に動的に変化する「プロンプト駆動イベント」は現時点では対応していない。Googleは、今後のアップデートでこれらの課題を改善していく方針。また、倫理的配慮も重視しており、AIの責任ある開発を基本理念としている。Google Labsでの研究として位置づけられ、実際の利用から得られるフィードバックをもとに、AI研究と生成メディアの両分野での進展を図る。 今後は米国から順次、他の地域への拡大を予定。ユーザーが創り出す無限に近い多様な世界の可能性に期待が高まり、将来的にはより広範な利用者に技術が届くことが目標となっている。
