テキスト1つで生成!AIが自動で作るナビゲート可能な3D世界「WorldGen」
「テキストから3Dの没入型世界を生成する」——新研究「WorldGen」の登場 「コメディ風の中世の村」や「火星に建つサイエンスフィクションの基地」など、単一のテキストプロンプトを入力するだけで、数分以内に一貫性のあるインタラクティブな3D世界が作成できる。この世界は、建築スタイルや時代背景に一貫性を持ち、中世の村に近代的な建物が混在するなど、不自然な要素が発生しない。また、自由に移動できる構造で、キャラクターが壁に詰まったり、場所の接続が途切れたりすることもない。数年前までSFに近い発想だったが、生成AIの進化により、今や1つのプロンプトから短い映像クリップが作成可能になっている。そして今回、その次世代技術として「WorldGen」が発表された。 WorldGenは、テキスト1つから、完全にナビゲート可能でインタラクティブな3D世界を一貫して生成する、エンド・トゥ・エンドの先進的システム。プロシージャルな推論、拡散型3D生成、オブジェクト認識型シーン分解技術を統合。結果として、幾何学的に整合性があり、視覚的に豊かで、レンダリング効率の高い3D世界が実現。ゲーム、シミュレーション、没入型SNS環境など、多様な分野への応用が期待される。 従来の手法は、特定の視点から始めて周囲を拡張する方式が主流。そのため、中心部は高品質でも、3~5メートル離れるだけで品質が急激に低下する。これに対し、WorldGenは50×50メートルの広大なシーンを、一貫したスタイルと幾何学的整合性で生成。今後はさらに大きな世界の生成と、生成遅延の低減を進める予定。 現段階では開発者向けの提供は行われていないが、生成されたコンテンツはUnityやUnreal Engineといった標準ゲームエンジンと互換性があり、追加の変換やレンダリングパイプライン不要。3Dコンテンツ制作は従来、時間と専門知識が不可欠だったが、WorldGenはその障壁を大幅に下げる。この技術は、誰もがコードを書かずに、自らの想像を形にできる未来——「Connect」で発表したビジョンの実現に向けた重要な一歩となる。 本研究はDilin Wang、Hyunyoung Jung、Tom Monnier、Kihyuk Sohn、Chuhang Zou、Xiaoyu Xiang、Yu-Ying Yeh、Di Liu、Zixuan Huang、Thu Nguyen-Phuoc、Yuchen Fan、Sergiu Oprea、Ziyan Wang、Roman Shapovalov、Nikolaos Sarafianos、Thibault Groueix、Antoine Toisoul、Prithviraj Dhar、Xiao Chu、Minghao Chen、Geon Yeong Park、Mahima Gupta、Yassir Azziz、Milton Cadogan、Christopher Ocampo、Sandy Kao、Rakesh Ranjan、Andrea Vedaldiらの共同研究によるもの。プロジェクトリードはAndrea Vedaldi。
