2 个月前

NU-MCC:具有邻域解码器和排斥UDF的多视图压缩编码

Lionar, Stefan ; Xu, Xiangyu ; Lin, Min ; Lee, Gim Hee
NU-MCC:具有邻域解码器和排斥UDF的多视图压缩编码
摘要

在单视图RGB-D输入的3D重建领域已经取得了显著进展。MCC是该领域的当前最先进方法,通过结合视觉Transformer和大规模训练实现了前所未有的成功。然而,我们发现了MCC的两个关键局限:1)Transformer解码器在处理大量查询点时效率低下;2)3D表示难以恢复高保真细节。本文提出了一种新的方法——NU-MCC,以解决这些局限。NU-MCC包含两项关键技术革新:邻域解码器(Neighborhood decoder)和排斥无符号距离函数(Repulsive Unsigned Distance Function, Repulsive UDF)。首先,我们的邻域解码器引入了中心点作为输入视觉特征的有效代理,使得每个查询点仅关注一个小邻域。这一设计不仅大大提高了推理速度,还能够利用更细粒度的视觉特征来改善3D纹理的恢复效果。其次,我们提出的排斥UDF是MCC中使用的占据场(occupancy field)的一种新颖替代方案,显著提升了3D物体重建的质量。与标准UDF在结果中存在空洞的问题相比,我们的排斥UDF能够实现更完整的表面重建。实验结果表明,NU-MCC能够学习到强大的3D表示,在单视图3D重建方面大幅推进了现有技术水平。特别是在CO3D-v2数据集上,NU-MCC在F1分数上比MCC高出9.7%,且运行速度超过5倍。