
神经辐射场(Neural Radiance Fields, NeRFs)在高保真度捕捉复杂三维场景方面展现了巨大潜力。然而,阻碍其广泛应用的一个持续性挑战是基于体素渲染(volumetric rendering)所带来的计算瓶颈。另一方面,三维高斯溅射(3D Gaussian Splatting, 3DGS)作为一种新兴的替代表示方法,采用基于三维高斯的显式表示,并借助光栅化流水线进行图像渲染,而非传统的体素渲染,从而实现了极快的渲染速度和令人期待的图像质量。然而,3DGS的一个显著缺陷在于,为保持渲染图像的高保真度,需使用大量三维高斯点,导致对内存和存储空间的需求显著增加。针对这一关键问题,本文聚焦于两个核心目标:在不牺牲性能的前提下显著减少高斯点的数量,同时对高斯属性(如视角依赖的颜色和协方差)进行高效压缩。为此,我们提出了一种可学习的掩码策略(learnable mask strategy),能够大幅削减高斯点数量,同时保持优异的渲染性能。此外,我们引入了一种基于网格的神经场(grid-based neural field)来表示视角依赖的颜色,替代传统依赖球谐函数(spherical harmonics)的方法,实现了更紧凑且有效的颜色建模。最后,我们通过向量量化(vector quantization)学习码本(codebooks),对高斯的几何属性进行紧凑表示。结合量化(quantization)与熵编码(entropy coding)等模型压缩技术,我们的方法在保持场景表示质量的前提下,相较原始3DGS实现了超过25倍的存储空间压缩,并显著提升了渲染速度。本工作构建了一个完整的三维场景表示框架,兼顾高性能、快速训练、紧凑存储与实时渲染能力。项目主页详见:https://maincold2.github.io/c3dgs/。