17 天前

CityDreamer:无限三维城市的组合生成模型

Haozhe Xie, Zhaoxi Chen, Fangzhou Hong, Ziwei Liu
CityDreamer:无限三维城市的组合生成模型
摘要

三维城市生成是一项既具有吸引力又极具挑战性的任务,因为人类对城市环境中结构失真尤为敏感。此外,与三维自然场景相比,三维城市生成的复杂性更高:在自然场景中,树木等同类物体的外观相对一致,而建筑物作为同一类对象,其外观差异却更为显著。为应对这些挑战,我们提出了一种专为无界三维城市设计的组合式生成模型——CityDreamer。我们的核心思想是,三维城市生成应被建模为多种神经场的组合:1)各类建筑实例,以及2)背景元素(如道路、绿地等)。具体而言,我们采用鸟瞰视角(bird’s eye view)的场景表示方法,并对面向实例的神经场与面向背景元素的神经场均采用体素渲染(volumetric rendering)技术。针对建筑实例与背景元素的不同特性,我们定制了生成式哈希网格(generative hash grid)与周期性位置编码(periodic positional embedding)作为场景参数化方式。此外,我们构建了一套名为CityGen的综合数据集,涵盖OSM与Google Earth等来源,包含大量真实世界的城市图像数据,显著提升了生成三维城市在布局与外观上的真实感。实验结果表明,CityDreamer不仅在生成逼真三维城市方面达到当前最优性能,还能实现对生成城市中局部区域的高效编辑。