
摘要
我们提出了一种新颖的端到端可训练深度编码器-解码器架构,用于单次通过的语义分割任务。该方法基于级联结构,并引入了特征级的长距离跳跃连接。编码器采用ResNeXt残差模块的结构,并通过重复使用具有相同拓扑结构的变换组合模块来实现特征聚合。解码器则设计了一种新型模块化架构,能够实现三个关键功能:(i)捕获上下文信息,(ii)生成语义特征,以及(iii)实现不同输出分辨率之间的特征融合。尤为重要的是,我们引入了密集的解码器快捷连接(dense decoder shortcut connections),使得每个解码器模块能够利用其之前所有层级的语义特征图,即来自所有更高层次的特征图。这种密集连接机制有效促进了信息在解码器各模块间的传播,并实现了多层次特征的深度融合,显著提升了分割精度。值得注意的是,该方法在多个具有挑战性的数据集上均取得了当前最优的性能表现,且无需像以往方法那样依赖耗时的多尺度推理平均策略。