Command Palette
Search for a command to run...
用于3D生成的原生与紧凑结构化隐变量
用于3D生成的原生与紧凑结构化隐变量
摘要
近年来,三维生成建模技术的进展显著提升了生成结果的真实感,但该领域仍受限于现有表示方法,难以有效捕捉具有复杂拓扑结构和精细外观的三维资产。本文提出一种从原生三维数据中学习结构化潜在表示的新方法,以应对这一挑战。其核心是一种新型稀疏体素结构——O-Voxel,即全向体素(omni-voxel)表示,能够同时编码几何形状与外观信息。O-Voxel 可稳健地建模任意拓扑结构,包括开放表面、非流形结构以及完全封闭的表面,同时能够捕捉超越纹理颜色的全面表面属性,例如基于物理的渲染参数。基于 O-Voxel,我们设计了一种稀疏压缩变分自编码器(Sparse Compression VAE),实现了高空间压缩率与紧凑的潜在空间。我们利用多样化的公开三维资产数据集,训练了包含 40 亿参数的大规模流匹配生成模型,用于三维内容生成。尽管模型规模庞大,推理过程依然保持极高的效率。与此同时,我们生成资产的几何精度与材质质量显著优于现有方法。我们认为,本方法在三维生成建模领域实现了重要突破。