
摘要
近期的研究引入了一类新的生成模型,用于合成隐式神经表示(INRs),这些模型能够捕捉不同领域的任意连续信号。这类模型为领域无关的生成模型打开了大门,但通常难以实现高质量的生成。我们观察到,现有的方法通过生成神经网络的权重来参数化INRs,并使用固定的 positional embeddings (PEs) 来评估网络。可以认为,这种架构限制了生成模型的表达能力,导致了低质量的 INR 生成。为了克服这一局限,我们提出了一种领域无关的隐式神经表示潜在扩散模型(DDMI),该模型生成自适应的位置嵌入而不是神经网络的权重。具体而言,我们开发了一种离散到连续空间变分自编码器(D2C-VAE),它在共享潜在空间中无缝连接离散数据和连续信号函数。此外,我们还引入了一种新颖的条件机制,通过分层分解的位置嵌入来评估 INRs,以进一步增强其表达能力。广泛的实验表明,在四个模态(例如2D图像、3D形状、Neural Radiance Fields和视频)上使用七个基准数据集进行测试时,DDMI展现了其多功能性和相比现有 INR 生成模型的优越性能。