2 个月前

一百层提拉米苏:用于语义分割的全卷积密集网络

Simon Jégou; Michal Drozdzal; David Vazquez; Adriana Romero; Yoshua Bengio
一百层提拉米苏:用于语义分割的全卷积密集网络
摘要

最先进的语义图像分割方法基于卷积神经网络(CNN)。典型的分割架构由以下部分组成:(a) 下采样路径,负责提取粗略的语义特征;(b) 上采样路径,训练用于在模型输出时恢复输入图像的分辨率;以及可选的 (c) 后处理模块(例如条件随机场)以优化模型预测。最近,一种新的CNN架构——密集连接卷积网络(DenseNets)在图像分类任务中表现出色。DenseNets 的设计理念源于观察到如果每个层都以前馈方式直接连接到其他所有层,则网络将更加准确且更容易训练。在本文中,我们将DenseNets扩展应用于语义分割问题。我们在CamVid和Gatech等城市场景基准数据集上取得了最先进的结果,而无需任何额外的后处理模块或预训练。此外,由于模型构建的巧妙设计,我们的方法在这类数据集上的参数量远少于目前公布的最佳方案。实验代码可在此处获取:https://github.com/SimJeg/FC-DenseNet/blob/master/train.py