7 个月前

摘要

在许多实际应用中，如自动驾驶和机器人导航，稳健的几何和语义场景理解变得越来越重要。本文提出了一种基于多任务学习的方法，能够同时进行几何和语义场景理解，具体包括深度预测（单目深度估计和深度补全）和语义场景分割。在单一的时间约束递归网络中，我们的方法独特地利用了一系列复杂的跳跃连接、对抗训练以及连续帧的时间约束，以同时生成一致的深度和语义类别标签。广泛的实验评估表明，与当前其他最先进的技术相比，我们的方法具有更高的有效性。

源 PDF