
摘要
机器学习需要数据,但获取和标注现实世界的数据具有挑战性、成本高昂且耗时。更重要的是,一旦数据采集完成,几乎不可能对其进行修改(例如,改变房间的光照),这使得测量数据的特定属性如何影响性能变得非常困难。在本文中,我们介绍了一种名为AI Playground (AIP)的开源工具,该工具基于Unreal Engine生成和标注虚拟图像数据。通过AIP,可以轻松地在不同条件下(如保真度、光照等)捕获同一图像,并使用不同的真实值(如深度或表面法线值)。AIP易于扩展,既可以通过代码使用,也可以不通过代码使用。为了验证我们提出的工具,我们生成了八个数据集,这些数据集在其他方面相同但在光照和保真度条件上有所差异。随后,我们训练了深度神经网络以预测(1)深度值、(2)表面法线或(3)对象标签,并评估了每个网络在单个数据集内和跨数据集的性能。除其他见解外,我们证实了对不同设置的敏感性是问题依赖的。我们确认了其他研究的结果,即分割模型对保真度非常敏感,但我们还发现它们对光照同样敏感。相比之下,深度和法线估计模型似乎对保真度或光照不太敏感,而对图像结构更为敏感。最后,我们在两个现实世界的数据集上测试了训练好的深度估计网络,并获得了与仅用现实世界数据训练相当的结果,证明我们的虚拟环境足以用于现实世界的任务。