13 天前

LiteSeg:一种用于语义分割的新颖轻量级ConvNet

Taha Emara, Hossam E. Abd El Munim, Hazem M. Abbas
LiteSeg:一种用于语义分割的新颖轻量级ConvNet
摘要

语义图像分割在自动驾驶、医学图像分析等诸多视觉应用中发挥着关键作用。以往的多数方法主要致力于提升模型的精度,而对计算效率的关注相对较少。本文提出 LiteSeg,一种面向语义图像分割的轻量化网络架构。在本研究中,我们设计了一种新型的深层空洞空间金字塔池化模块(Atrous Spatial Pyramid Pooling, ASPP),并引入短距离与长距离残差连接,以及深度可分离卷积,从而构建出一个兼具高效性与快速性的模型。LiteSeg 架构在多个主干网络(包括 Darknet19、MobileNet 和 ShuffleNet)上进行了验证,实现了精度与计算成本之间的多维度权衡。实验结果表明,当以 MobileNetV2 作为主干网络时,所提出的 LiteSeg 模型在 Cityscapes 数据集上以 $640 \times 360$ 分辨率运行时,达到了 67.81% 的平均交并比(mean Intersection over Union, mIoU),推理速度高达每秒 161 帧(161 FPS)。