
摘要
在许多实际应用中,如自动驾驶和机器人导航,稳健的几何和语义场景理解变得越来越重要。本文提出了一种基于多任务学习的方法,能够同时进行几何和语义场景理解,具体包括深度预测(单目深度估计和深度补全)和语义场景分割。在单一的时间约束递归网络中,我们的方法独特地利用了一系列复杂的跳跃连接、对抗训练以及连续帧的时间约束,以同时生成一致的深度和语义类别标签。广泛的实验评估表明,与当前其他最先进的技术相比,我们的方法具有更高的有效性。

在许多实际应用中,如自动驾驶和机器人导航,稳健的几何和语义场景理解变得越来越重要。本文提出了一种基于多任务学习的方法,能够同时进行几何和语义场景理解,具体包括深度预测(单目深度估计和深度补全)和语义场景分割。在单一的时间约束递归网络中,我们的方法独特地利用了一系列复杂的跳跃连接、对抗训练以及连续帧的时间约束,以同时生成一致的深度和语义类别标签。广泛的实验评估表明,与当前其他最先进的技术相比,我们的方法具有更高的有效性。