11 天前

PP-LiteSeg:一种卓越的实时语义分割模型

Juncai Peng, Yi Liu, Shiyu Tang, Yuying Hao, Lutao Chu, Guowei Chen, Zewu Wu, Zeyu Chen, Zhiliang Yu, Yuning Du, Qingqing Dang, Baohua Lai, Qiwen Liu, Xiaoguang Hu, Dianhai Yu, Yanjun Ma
PP-LiteSeg:一种卓越的实时语义分割模型
摘要

现实世界的应用对语义分割方法提出了较高要求。尽管深度学习推动了语义分割技术的显著进步,但现有实时语义分割方法的性能仍不尽如人意。本文提出PP-LiteSeg,一种面向实时语义分割任务的新型轻量化模型。具体而言,我们设计了一种灵活轻量的解码器(Flexible and Lightweight Decoder, FLD),有效降低了传统解码器的计算开销。为增强特征表示能力,我们提出统一注意力融合模块(Unified Attention Fusion Module, UAFM),该模块结合空间注意力与通道注意力生成权重,并利用该权重对输入特征进行融合。此外,我们还引入一种简单金字塔池化模块(Simple Pyramid Pooling Module, SPPM),以较低的计算成本聚合全局上下文信息。大量实验结果表明,PP-LiteSeg在准确率与推理速度之间实现了优越的平衡。在Cityscapes测试集上,PP-LiteSeg在NVIDIA GTX 1080Ti显卡上分别达到72.0% mIoU/273.6 FPS和77.5% mIoU/102.6 FPS的性能。源代码与预训练模型已开源,可在PaddleSeg项目中获取:https://github.com/PaddlePaddle/PaddleSeg。

PP-LiteSeg:一种卓越的实时语义分割模型 | 最新论文 | HyperAI超神经