2 个月前
Pixel2Mesh:从单张RGB图像生成3D网格模型
Nanyang Wang; Yinda Zhang; Zhuwen Li; Yanwei Fu; Wei Liu; Yu-Gang Jiang

摘要
我们提出了一种端到端的深度学习架构,该架构可以从单张彩色图像生成三角网格形式的3D形状。由于深度神经网络的固有限制,以往的方法通常以体素或点云的形式表示3D形状,将其转换为更易用的网格模型并非易事。与现有方法不同,我们的网络采用基于图卷积的神经网络来表示3D网格,并通过逐步变形椭球体来生成正确的几何结构,利用从输入图像中提取的感知特征。为了确保整个变形过程的稳定性,我们采用了由粗到细的策略,并定义了多种与网格相关的损失函数,以捕捉不同层次的属性,从而保证生成的3D几何结构在视觉上令人满意且物理上准确。大量实验表明,我们的方法不仅在定性方面能够生成细节更好的网格模型,而且在3D形状估计精度上也优于现有最先进方法。