17 天前

ERFNet:用于实时语义分割的高效残差分解卷积网络

{L. M. Bergasa and R. Arroyo, E. Romera, J. M. Alvarez}
摘要

语义分割是一项具有挑战性的任务,能够以统一的方式满足智能车辆(Intelligent Vehicles, IV)的大部分感知需求。深度神经网络在该任务中表现优异,因其可通过端到端训练,在像素级别上精确分类图像中的多种物体类别。然而,当前最先进的语义分割方法在高质量输出与计算资源消耗之间尚未实现理想的平衡,限制了其在实际车辆系统中的应用。本文提出了一种新型深度网络架构,能够在实时运行的同时提供高精度的语义分割结果。该架构的核心是一种创新的网络层,结合了残差连接(residual connections)与分解卷积(factorized convolutions),在保持卓越准确率的同时显著提升了计算效率。实验结果表明,该方法在单块Titan X显卡上可实现超过83帧/秒(FPS)的推理速度,在Jetson TX1(嵌入式GPU)上也可达到7 FPS。在公开可用的Cityscapes数据集上进行的全面实验表明,本方法在精度上与当前最先进水平相当,但计算速度比其他达到顶尖精度的架构快出数个数量级。这一优异的性能-效率权衡使本模型成为智能车辆场景理解应用的理想选择。相关代码已公开,地址为:https://github.com/Eromera/erfnet