WorldGen:AI 一键生成沉浸式三维世界,开启文本到虚拟现实新纪元
近日,一项名为WorldGen的突破性研究发布,标志着从文本到沉浸式3D世界生成迈出了关键一步。用户只需输入一句简单提示,如“卡通风格的中世纪村庄”或“火星上的科幻基地站”,系统便能在数分钟内生成一个风格统一、几何连贯、可自由探索的完整3D虚拟世界。与传统方法不同,WorldGen不仅在中心视角区域保持高画质,更能在50×50米的广阔范围内维持一致的视觉与结构完整性,避免出现风格错乱或场景断裂的问题。 WorldGen是一个端到端的生成系统,融合了程序化推理、基于扩散模型的3D生成技术以及对象感知的场景分解方法。其工作流程包括:场景规划、程序化布局生成、导航网格提取、参考图像生成、图像到3D的重建、场景部件拆分、数据清洗、细节优化、网格与纹理精修等多个阶段。通过这一系列技术,系统能生成既视觉丰富又渲染高效的3D环境,适用于游戏开发、虚拟仿真和沉浸式社交平台。 与现有方法相比,许多现有技术仅以单一视角为起点生成3D内容,导致远离中心区域的场景质量迅速下降。而WorldGen通过全局参考图像和完整布局建模,实现了更稳定、更可扩展的生成效果。尽管目前仍处于研究阶段,尚未向开发者开放,但其生成内容已兼容Unity和Unreal等主流游戏引擎,无需额外转换或渲染流程。 研究团队指出,当前版本在生成规模和速度上仍有提升空间,未来将致力于支持更大世界、降低生成延迟。WorldGen的出现,有望大幅降低3D内容创作的时间与成本门槛,推动虚拟世界构建从专业团队走向大众。这正是Meta在Connect大会上所描绘的愿景:未来每个人都能无需编写代码,便能自由创造完整的虚拟世界。 本研究由Dilin Wang、Hyunyoung Jung、Tom Monnier、Kihyuk Sohn等多位研究人员共同完成,项目由Andrea Vedaldi领导。
