2 个月前

SuperCaustics:用于深度学习应用的实时、开源透明物体仿真

Mehdi Mousavi; Rolando Estrada
SuperCaustics:用于深度学习应用的实时、开源透明物体仿真
摘要

透明物体在计算机视觉中是一个非常具有挑战性的问题。由于缺乏精确的边界,它们难以进行分割或分类,而且用于训练深度神经网络的数据有限。因此,目前解决这一问题的方法主要依赖于刚性的合成数据集,这些数据集缺乏灵活性,并且在实际应用中会导致严重的性能下降。特别是,这些合成数据集由于渲染管道的限制而忽略了折射、色散和聚光等特征。为了解决这一问题,我们提出了SuperCaustics,这是一款专为深度学习应用设计的实时开源透明物体模拟系统。SuperCaustics具备广泛的随机环境生成模块;利用硬件光线追踪技术支持聚光、色散和折射;并能够生成带有多种模态、像素级精准地面真注释的大规模数据集。为了验证我们提出的系统,我们从零开始训练了一个深度神经网络,以在复杂的光照条件下对透明物体进行分割。我们的神经网络仅使用10%的训练数据和较短的训练时间,在真实世界数据集上的表现就达到了与现有最先进方法相当的水平。进一步的实验表明,使用SuperCaustics训练的模型可以分割不同类型的聚光效果,即使在包含多个重叠透明物体的图像中也是如此。据我们所知,这是首次在合成数据上训练出能够实现这一效果的模型。我们的开源代码和实验数据均可在线免费获取。