17 天前

用于大规模多样化数据集的多项式隐式神经表示

Rajhans Singh, Ankita Shukla, Pavan Turaga
用于大规模多样化数据集的多项式隐式神经表示
摘要

隐式神经表示(Implicit Neural Representations, INR)在信号与图像表示领域获得了广泛关注,广泛应用于超分辨率、三维建模等多种下游任务。目前大多数INR架构依赖于正弦位置编码(sinusoidal positional encoding),以捕捉数据中的高频信息。然而,有限的编码尺寸限制了模型的表达能力。要实现从单张图像表示向大规模、多样化数据集表示的跨越,亟需更强的表达能力。本文提出一种新方法,通过多项式函数表示图像,从而摒弃了传统的位置编码。为逐步提升多项式表示的阶数,我们在每个ReLU层之后,对特征与仿射变换后的坐标位置进行逐元素乘法操作。所提出的Poly-INR模型在ImageNet等大规模数据集上进行了定性和定量评估。实验结果表明,该模型在不使用任何卷积、归一化或自注意力结构的情况下,性能可与当前最先进的生成模型相媲美,且参数量显著更少。凭借更少的可训练参数与更强的表达能力,本方法为复杂领域中INR模型在生成建模任务中的广泛应用铺平了道路。代码已开源,详见:\url{https://github.com/Rajhans0/Poly_INR}。

用于大规模多样化数据集的多项式隐式神经表示 | 最新论文 | HyperAI超神经